Siamo alla ricerca di un/una Senior Data Engineer talentuoso/a e motivato/a per unirsi al nostro team. Il/la candidato/a ideale avrà una solida esperienza in machine learning e processi ETL, e sarà autonomo/a negli ambiti big data. Conoscenze in ambito data ingestion e realtime processing sono considerate un importante valore aggiunto. Questa figura professionale sarà principalmente responsabile della progettazione, implementazione e gestione di pipeline di dati complesse e dell'integrazione dei modelli di machine learning sviluppati dal nostro team dedicato di Data Scientist. Sarà inoltre richiesto di sviluppare autonomamente modelli di machine learning semplici.
Responsabilità: Progettare, costruire e gestire pipeline di dati ETL. Collaborare con il team di Data Scientist per implementare e far girare modelli di machine learning complessi in ambiente di produzione. Sviluppare modelli di machine learning semplici in autonomia con supporto del team di Data Analyst. Ottimizzare le prestazioni delle pipeline di dati. Lavorare con grandi dataset e strumenti di big data. Implementare soluzioni di data storage e Data Warehouse, inclusi data lake, delta lake, e data lakehouse. Garantire la qualità e l'integrità dei dati attraverso pratiche di data governance. Affrontare le specifiche richieste dei diversi customer, utilizzando le tecniche, le fonti di dati e le tecnologie più appropriate. Sviluppare e mantenere documentazione tecnica e best practices per la gestione dei dati. Fornire mentoring e supporto ai membri junior/middle del team. Requisiti: Laurea in Informatica, Ingegneria Informatica, Matematica, Statistica o campi correlati. Esperienza lavorativa comprovata (almeno 5 anni) in ruoli simili. Ottime competenze in machine learning, con la capacità di sviluppare modelli semplici in autonomia e di integrare modelli complessi sviluppati da Data Scientist. Proficienza in Python e SQL. Esperienza con framework di big data, in particolare Apache Spark (nativo o via PySpark). Esperienza nella progettazione e gestione di pipeline ETL complesse preferibilmente su Azure Data Factory. Esperienza in almeno una tra le piattaforme: Databricks (anche non in ambito Azure), Azure Fabric, Azure Synapse. Esperienza con database SQL, NoSQL, Colonnari e Time Series.
#J-18808-Ljbffr