En lagersoft estamos creciendo y nuestro sistema de datos necesita evolucionar al mismo ritmo.operamos una plataforma de gaming con múltiples fuentes de datos, flujos asíncronos y un volumen donde la consistencia y la trazabilidad no son opcionales.
nuestro stack incluye ingestión continua, procesamiento distribuido y distintos niveles de almacenamiento.buscamos un data engineer con fuerte criterio técnico para ayudarnos a evolucionar la arquitectura de datos — desde cómo se ingieren hasta cómo se modelan y consumen (reportería, analytics y llms).
este rol no es solo de implementación.
esperamos que identifiques problemas estructurales, propongas soluciones y las lleves a ejecución junto con el equipo.objetivo del roldiseñar y evolucionar la arquitectura de datos end-to-end — ingestión, procesamiento, modelado y consumo — para habilitar reporting confiable, analítica y consumo por llms a escala.responsabilidades- diseñar y evolucionar la arquitectura de datos end-to-end- definir criterios y estándares para la construcción de datasets reutilizables- construir capas que habiliten reporting confiable y consumo por llms- diseñar modelado de datos alineado a necesidades de negocio- optimizar performance y costos sobre servicios aws- identificar y corregir problemas de escalabilidad en pipelines, storage y queries- colaborar en la construcción de pipelines (airflow, pyspark, glue)- participar en decisiones de arquitectura e ingeniería de datos- analizar problemas de calidad de datos, consistencia y trazabilidad- contribuir a la evolución del stack evaluando trade-offs reales️ stack - capatecnologías- procesamiento python / pyspark- orquestación airflow, aws glue- storage s3, formatos de metadata (delta / iceberg)- bases de datos aurora rds, athena, redshift- consumo power bi, llms / agentsperfil requerido- experiencia diseñando pipelines y arquitecturas de datos en producción- experiencia con modelado de datos para analítica- experiencia con grandes volúmenes de datos (batch y/o near real-time)- procesamiento distribuido (spark / pyspark)- conocimiento de data lakes y capas de metadatos (delta, iceberg, hudi)- experiencia con orquestación (airflow o similares)- buen entendimiento de performance en bases olap y oltp- familiaridad con el ecosistema aws- inglés técnico- plus: familiaridad con arquitecturas orientadas a eventos o streamingcómo trabajas- pensamiento sistémico — entiendes el sistema completo, no solo piezas aisladas- criterio técnico — tomas decisiones con trade-offs claros- ownership — tomas problemas abiertos y los llevas a solución concreta- pragmatismo — sabes cuándo estandarizar y cuándo resolver rápido- comunicación clara — explicas decisiones técnicas y sus implicaciones- orientación a negocio — entiendes que el valor está en cómo se usan los datos, no solo en cómo se procesanforma de trabajo- ciclos iterativos, orientados a problemas reales — no solo a tickets- discusión técnica y refinamiento en equipo como parte del día a día- criterio para priorizar entre deuda técnica, nuevas necesidades y evolución del sistema- se espera que propongas rutas técnicas para soluciones generales, no solo puntualesel equiposerás parte de un equipo de datos de ~5 personas.
tu rol es elevar la calidad técnica del equipo y ayudar a que las decisiones de arquitectura escalen en el tiempo.
trabajarás de forma cercana con líderes técnicos, producto y otras áreas.lo que ofrecemos- equipo técnico pequeño y de alto nivel- problemas reales de escala — no casos de laboratorio- espacio para influir en decisiones de arquitectura desde el día uno- stack moderno con llms y agents como ciudadanos de primera clase- esquema híbrido en monterrey, nl- sin burocracia, con foco absoluto en ejecución