En layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas. Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año. Aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida personal y profesional. Si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar. Como generative ai engineer de nivel medio, tu misión será diseñar, entrenar e implementar sistemas conversacionales que integren voz, texto y contexto. Trabajarás en estrecha colaboración con los equipos de producto, ingeniería y ciencia de datos, contribuyendo al desarrollo de un pipeline completo de speech-to-speech ai agents. Responsabilidades diseñar, implementar y optimizar agentes de voz basados en modelos de lenguaje grande (llms) y modelos de voz (tts/stt). Desarrollar pipelines de conversación continua (speech→text→llm→speech) con foco en latencia baja y naturalidad de respuesta. Aplicar técnicas de prompt engineering y context management para mantener coherencia, memoria conversacional y control de tono. Integrar modelos generativos en entornos backend (fastapi, langchain, langgraph, autogen o equivalentes). Afinar y evaluar modelos multimodales, incluyendo fine-tuning de tts (pipertts, cosyvoice, bark) y asr (whisper, whisperx). Desarrollar métricas internas de evaluación de diálogo (inteligibilidad, empatía, consistencia contextual). Monitorear el desempeño de los modelos en producción y aplicar técnicas de feedback-based optimization. Colaborar en la definición de nuevas funcionalidades de agentes de voz, incluyendo integración con telefonía o webrtc. Oportunidades de desarrollo desarrollar modelos de voz personalizados y comprender la arquitectura de sistemas speech-speech real-time. Trabajar con tecnologías de vanguardia: whisperx, pipertts, gpt-4o, gemini 1.5 pro, langgraph, y motores de inferencia acelerados (groq, onnx runtime). Diseñar prompt stacks y context planners para agentes autónomos conversacionales. Participar en proyectos que combinan ia generativa, emociones y conversación natural, con impacto directo en miles de usuarios. Además, tendrás la responsabilidad de investigar y proponer las mejores herramientas y técnicas para optimizar los procesos de análisis y documentación. Habilidades y competencias requeridas dominio avanzado de python y experiencia en desarrollo de apis restful o websocket. Experiencia práctica con tecnologías de openai, whisper, pipertts, langchain, langgraph, autogen o similares. Conocimientos sólidos en procesamiento de audio, diarización, embeddings de voz y voice activity detection (vad). Experiencia en mlops (docker, entornos virtuales, mlflow, dvc, control de versiones de modelos). Experiencia comprobable en despliegue de modelos speech o generativos en entornos reales (mínimo 2 años). Habilidad para analizar resultados de modelos generativos y proponer mejoras cuantitativas y cualitativas. Capacidad para trabajar en equipo multidisciplinario, con criterio técnico y comunicación efectiva. Ambiente de trabajo: formarás parte de un equipo especializado en ia generativa aplicada a voz y lenguaje, con alto nivel técnico y enfoque ético. Promovemos un entorno de aprendizaje constante, colaboración abierta y responsabilidad compartida. Tendrás autonomía técnica y apoyo continuo para impulsar tus ideas hacia producción. ¡únete a nuestro equipo! ¡queremos que formes parte de nuestro talentoso equipo de profesionales! Aprovecha esta oportunidad para desarrollar tus habilidades y crecer profesionalmente en un ambiente dinámico y colaborativo. Este rol es ideal para un profesional con experiencia en ia conversacional, síntesis y comprensión del habla, que desee construir agentes de voz inteligentes y autónomos. Buscamos a alguien que disfrute diseñar experiencias naturales entre humanos y máquinas, dominando tanto la parte técnica como la creatividad aplicada al diseño de conversación. Monterrey, nuevo león, mexico 2 months ago guadalajara, jalisco, mexico $5,000.00-$6,000.00 1 week ago mexico (remote) :: staff / principal generative ai engineer j-18808-ljbffr