Objetivo del rol
diseñar y evolucionar la arquitectura de datos end-to-end — ingestión, procesamiento, modelado y consumo — para habilitar reporting confiable, analítica y consumo por llms a escala.
responsabilidades
* diseñar y evolucionar la arquitectura de datos end-to-end
* definir criterios y estándares para la construcción de datasets reutilizables
* construir capas que habiliten reporting confiable y consumo por llms
* diseñar modelado de datos alineado a necesidades de negocio
* optimizar performance y costos sobre servicios aws
* identificar y corregir problemas de escalabilidad en pipelines, storage y queries
* colaborar en la construcción de pipelines (airflow, py spark, glue)
* participar en decisiones de arquitectura e ingeniería de datos
* analizar problemas de calidad de datos, consistencia y trazabilidad
* contribuir a la evolución del stack evaluando trade-offs reales
stack
capa tecnologías – procesamiento: python / py spark; orquestación: airflow, aws glue; storage: s3, metadata formats delta / iceberg; bases de datos: aurora rds, athena, redshift; consumo: power bi, llms / agents.
perfil requerido
* experiencia diseñando pipelines y arquitecturas de datos en producción
* experiencia con modelado de datos para analítica
* experiencia con grandes volúmenes de datos (batch y/o near real-time)
* procesamiento distribuido (spark / py spark)
* conocimiento de data lakes y capas de metadatos (delta, iceberg, hudi)
* experiencia con orquestación (airflow o similares)
* buen entendimiento de performance en bases olap y oltp
* familiaridad con el ecosistema aws
* inglés técnico
plus
* familiaridad con arquitecturas orientadas a eventos o streaming.
cómo trabajas
* pensamiento sistémico — entiendes el sistema completo, no solo piezas aisladas
* criterio técnico — tomas decisiones con trade-offs claros
* ownership — tomas problemas abiertos y los llevas a solución concreta
* pragmatismo — sabes cuándo estandarizar y cuándo resolver veloz
* comunicación clara — explicas decisiones técnicas y sus implicaciones
* orientación a negocio — entiendes que el valor está en cómo se usan los datos, no solo en cómo se procesan
forma de trabajo
* ciclos iterativos, orientados a problemas reales — no solo a tickets
* discusión técnica y refinamiento en equipo como parte del día a día
* criterio para priorizar entre deuda técnica, nuevas necesidades y evolución del sistema
el equipo
serás parte de un equipo de datos de ~5 personas. Tu rol es elevar la calidad técnica del equipo y ayudar a que las decisiones de arquitectura escalen en el tiempo. Trabajarás de forma cercana con líderes técnicos, producto y otras áreas.
lo que ofrecemos
* equipo técnico pequeño y de alto nivel
* problemas reales de escala - no casos de laboratorio
* espacio para influir en decisiones de arquitectura desde el día uno
* stack moderno con llms y agents como ciudadanos de primera clase
* esquema híbrido en monterrey, nl
* sin burocracia, con foco absoluto en ejecución
#j-18808-ljbffr