Ingeniero(a) en ciencia de datos
ubicación: villahermosa, tabasco
modalidad: presencial
tipo de puesto: tiempo completo
descripción del puesto
buscamos un(a) ingeniero(a) en ciencia de datos con experiencia en desarrollo e implementación de soluciones integrales de datos que soporten la toma de decisiones operativas y estratégicas dentro de la organización.
el rol es responsable de asegurar la calidad, disponibilidad y gobernanza de la información, integrando fuentes de datos en ambientes híbridos y cloud, así como desarrollando pipelines etl/elt y modelos analíticos bajo estándares de seguridad y cumplimiento normativo.
responsabilidades principales
* diseñar y desarrollar pipelines de ingestión, transformación y distribución de datos (etl/elt) en arquitecturas batch y streaming.
* implementar y mantener plataformas de datos en entornos cloud e híbridos, incluyendo data lake, data warehouse y lakehouse.
* optimizar consultas, modelos dimensionales y estructuras de datos para mejorar rendimiento, costos y escalabilidad.
* garantizar la calidad, integridad y trazabilidad de los datos mediante validaciones, pruebas y herramientas de observabilidad.
* implementar políticas de seguridad, control de accesos y cumplimiento normativo en protección de datos.
* colaborar con equipos multidisciplinarios para entender requerimientos y desarrollar soluciones analíticas y operativas.
* documentar arquitecturas, procesos, apis, contratos de datos y manuales técnicos.
* capacitar y apoyar a usuarios y equipos en buenas prácticas y uso de plataformas de datos.
* desarrollar dashboards y soluciones de visualización utilizando power bi.
requisitosescolaridad
ingeniería o licenciatura en:
* computación
* sistemas
* telecomunicaciones
* matemáticas
* estadística
* ciencia de datos o carrera afín
experiencia
* mínimo 5 años de experiencia en ingeniería de datos, ciencia de datos o roles similares en entornos productivos.
* experiencia comprobable implementando soluciones de datos en la nube (aws, azure, gcp o equivalentes).
* experiencia en proyectos de machine learning, inteligencia artificial o analítica avanzada será un plus.
conocimientos técnicos
lenguajes
* python
* sql
* deseable: java, scala o go
herramientas y tecnologías
* spark
* kafka
* airflow
* dbt
* terraform
* kubernetes
* docker
plataformas cloud
* bigquery
* redshift
* synapse
* s3 / blob storage
* dataflow / dataproc
* o equivalentes
modelado y arquitectura de datos
* data warehouse
* data lake
* lakehouse
* modelado dimensional
analítica y visualización
* power bi (deseable)
machine learning
* scikit-learn
* tensorflow o pytorch
* deployment y monitoreo de modelos
gobernanza y seguridad
* iam
* cifrado y protección de datos
* catalogación, linaje y políticas de retención
competencias
* pensamiento analítico y resolución de problemas complejos.
* comunicación efectiva con equipos técnicos y de negocio.
* trabajo colaborativo y orientación a resultados.
* organización y atención al detalle.
* proactividad y enfoque en mejora continua.
requisitos adicionales
* inglés técnico deseable.
* disponibilidad para participar en guardias o atención de incidentes críticos fuera de horario laboral.
tipo de puesto: tiempo completo
sueldo: $35, $45,000.00 al mes
beneficios:
* seguro de vida
pregunta(s) de postulación:
* ¿dónde radicas? ¿puedes laborar en villahermosa?
* ¿cuáles son tus pretensiones salariales?
* ¿actualmente te encuentras laborando?
* ¿tienes experiencia en modelado de datos, data warehouse, data lake o lakehouse?
* ¿tienes experiencia comprobable implementando soluciones de ingeniería de datos en cloud (aws, azure, gcp, etc.)?
* ¿tienes experiencia utilizando python, sql?
lugar de trabajo: empleo presencial