Postée il y a 24 heures
Poste : Lead Data Engineer
Lieu : Malakoff
Secteur : Culture / Presse
CDI
Dans l'optique de devenir data centric et faire évoluer la Data Platform actuelle, le Lead Data Engineer devra :
- construire une plateforme au cœur du SI pour consolider toutes les données liées aux clients/prospects et contenus
- activer et exploiter les données à travers l'IA
Vous serez responsable de la conception, du développement et de l'optimisation des infrastructures de données avec une répartition des missions comme suit :
o 30% sur le management et l'encadrement d'équipe : équipe de 4 personnes
o 30% sur la conception et l'architecture des infrastructures data.
o 40% sur l'opérationnel et la gestion de projet.
Cette base repose sur les 3 étapes de préparation et présentation de la donnée que sont le datalake, le datawarehouse et les datamarts. Son architecture technique repose principalement sur AWS et l'ETL Talend pour la gestion des flux de données.
Vos missions principales :
- Concevoir et mettre en place l'architecture data de la plateforme, basée sur AWS
- Développer et optimiser les pipelines de traitement et d'intégration des données (DataLake, DataWarehouse, Datamarts) en Batch et Streaming
- Assurer la gouvernance des données : qualité, sécurité, accessibilité
- Encadrer et accompagner une équipe d'ingénieurs data
- Automatiser les flux de données et améliorer la performance des traitements
- Collaborer avec les équipes Data Gouvernance, CRM, infrastrictures et marketing pour garantir la disponibilité et la qualité des données
- Mettre en place des indicateurs de suivi et de cohérence des flux de données
- Assurer une documentation technique rigoureuse pour assurer la pérennité des solutions mises en place
- Piloter les projets data et assurer leur bonne exécution en respectant les délais et les exigences métier
- Apporter une assistance technique du modèle de données et vous réaliserez les évolutions à apporter en intégrant et automatisant les évolutions
Bac +5 avec une expérience significative en data engineering et gestion d'équipe
Connaissance des outils et plateformes (Talend ETL/ESB, Redshift, S3, RDS, Dataiku, Tableau, GitLab)
Maîtrise d'au moins un langage de programmation : Python/Java/Scala
Expertise sur les bases de données SQL et NoSQL (Redshift, PostgreSQL, MongoDB, etc.)
Expérience avec les outils d'ETL/ELT (Talend, Airflow, DBT, etc.)
Connaissance des architectures modernes de données (Data Lakehouse, Data Mesh, etc)
Expérience avec les solutions Cloud (AWS, GCP, Azure)
Connaissance des technologies de streaming (Kafka, Spark Streaming)
Expérience en CI/CD appliqué à la data (Git, Docker, Terraform)
Esprit analytique et résolution de problèmes complexes
2 jours de télé-travail par semaine
CE
Bac +5 avec une expérience significative en data engineering et gestion d'équipe
Connaissance des outils et plateformes (Talend ETL/ESB, Redshift, S3, RDS, Dataiku, Tableau, GitLab)
Maîtrise d'au moins un langage de programmation : Python/Java/Scala
Expertise sur les bases de données SQL et NoSQL (Redshift, PostgreSQL, MongoDB, etc.)
Expérience avec les outils d'ETL/ELT (Talend, Airflow, DBT, etc.)
Connaissance des architectures modernes de données (Data Lakehouse, Data Mesh, etc)
Expérience avec les solutions Cloud (AWS, GCP, Azure)
Connaissance des technologies de streaming (Kafka, Spark Streaming)
Expérience en CI/CD appliqué à la data (Git, Docker, Terraform)
Esprit analytique et résolution de problèmes complexes