¿Cuáles serán tus desafíos?
-Diseñar y construir pipelines de datos (ingesta, transformación, limpieza y normalización) utilizando Delta Lake, Unity Catalog y Spark.
-Conectar y extraer datos de diversas fuentes: archivos planos, bases de datos, APIs y streams.
-Desarrollar flujos de trabajo eficientes trabajando con datos estructurados, semiestructurados y no estructurados.
-Asegurar la calidad del dato implementando lógicas de validación y monitoreo.
-Colaborar con equipos multidisciplinarios para traducir requerimientos de negocio en modelos de datos accionables.
-Optimizar el rendimiento de procesos en entornos de computación distribuida y la nube.
¿Qué buscamos en ti? (Requisitos)
-Nivel de inglés B2 (conversacional, capaz de mantener reuniones con clientes).
-Más de 3 años de experiencia real en producción como Data Engineer utilizando Python, SQL y Databricks.
-Experiencia comprobable con Delta Lake, Spark Notebooks y Unity Catalog.
-Manejo de frameworks de transformación como DLT (Delta Live Tables), dbt o Apache Spark.
-Experiencia en entornos cloud (AWS o Azure) y procesos ETL/ELT.
-Conocimiento en DataOps: control de versiones (Git) y herramientas como Databricks Asset Bundles (DABs).
-Experiencia previa en consultoría o roles de cara al cliente (habilidades de comunicación y resolución de problemas).
Suma puntos si tienes (Deseable):
-Experiencia avanzada en optimización de rendimiento a gran escala y Databricks Workflows/Jobs.
-Familiaridad con herramientas de orquestación y ML como Airflow o MLflow.
-Manejo de librerías de visualización o herramientas BI (Matplotlib, Power BI, Tableau) para validación de datos.
- Aplica únicamente en Colombia.