Tipo de contrato: prestación de servicios / tiempo completo
estamos en busca de un data engineer que:
* sea proactivo y entusiasta, con iniciativa para proponer mejoras, nuevas ideas y soluciones creativas.
* disfrute trabajar en equipo y pueda colaborar con distintas áreas (finanzas, compras, supply chain, tecnología) para convertir datos en conocimiento.
* tenga la capacidad de explicar conceptos técnicos a perfiles no técnicos, generando puentes entre negocio y tecnología.
* muestre curiosidad constante y mentalidad de aprendizaje, manteniéndose actualizado en herramientas y tendencias del mundo de datos.
* sea resolutivo y analítico, con foco en entregar resultados de calidad en tiempos ajustados.
* conocimientos en lenguajes de programación esenciales para scripting, manipulación de
* datos y trabajo con bibliotecas de procesamiento de datos.
* habilidades de resolución de problemas para abordar desafíos de datos.
* conocimiento de sistemas de control de versiones como git para rastrear cambios en el
* código y facilitar la colaboración.
* comprensión básica de pipelines de integración y despliegue continuo (ci/cd) para
* automatizar pruebas de pipelines de datos e integrar cambios en modelos o scripts de datos.
responsabilidades
* diseñar, construir y mantener pipelines de datos robustos y eficientes que soporten grandes volúmenes de información.
* preparar, limpiar, transformar y estructurar datos provenientes de múltiples fuentes para asegurar su calidad, consistencia e integridad.
* modelar y organizar datos en estructuras optimizadas para análisis avanzado y generación de insights.
* integrar y desplegar modelos estadísticos y predictivos dentro de los flujos de datos productivos.
* colaborar estrechamente con equipos multidisciplinarios (finanzas, compras, supply chain, analistas de negocio, científicos de datos, ti) para diseñar soluciones de datos alineadas a los objetivos estratégicos.
* optimizar el rendimiento de las consultas sql y procesos en spark, garantizando escalabilidad y eficiencia en el manejo de datos masivos.
* administrar y operar entornos en azure databricks y azure data lake, asegurando el correcto flujo y almacenamiento de información.
* documentar procesos, modelos y pipeline s, generando guías claras para su mantenimiento y evolución.
* monitorear y dar soporte técnico a las soluciones de datos, resolviendo incidentes y asegurando la continuidad de los procesos.
* identificar oportunidades de mejora en procesos de datos y proponer soluciones innovadoras que incrementen la eficiencia y la calidad de la información.
* velar por las buenas prácticas de gobernanza y seguridad de datos, cumpliendo con lineamientos de confidencialidad y control de acceso.
* participar en revisiones técnicas y sesiones de mejora continua, aportando ideas para optimizar la arquitectura de datos de la organización.
* inglés técnico y conversacional
requisitos
* 2+ años de experiencia real en ingeniería de datos
* python (procesamiento de datos y modelamiento estadístico).
* sql (consultas avanzadas, optimización y manipulación de datos).
* r (análisis estadístico avanzado y modelamiento multivariado).
* spark (procesamiento distribuido de grandes volúmenes de datos).
* azure databricks y azure data lake storage (ecosistema azure).
* java