This is a remote position.
sobre layer7:
en layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas.
somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.
aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida personal y profesional.
si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar.
responsabilidades del puesto:
como generative ai engineer de nivel medio, tu misión será diseñar, entrenar e implementar sistemas conversacionales que integren voz, texto y contexto. Trabajarás en estrecha colaboración con los equipos de producto, ingeniería y ciencia de datos, contribuyendo al desarrollo de un pipeline completo de speech-to-speech ai agents.
tus principales responsabilidades incluirán:
* diseñar, implementar y optimizar agentes de voz basados en modelos de lenguaje grande (llms) y modelos de voz (tts/stt).
* desarrollar pipelines de conversación continua (speech text llm speech) con foco en latencia baja y naturalidad de respuesta.
* aplicar técnicas de prompt engineering y context management para mantener coherencia, memoria conversacional y control de tono.
* integrar modelos generativos en entornos backend (fastapi, langchain, langgraph, autogen o equivalentes).
* afinar y evaluar modelos multimodales, incluyendo fine-tuning de tts (pipertts, cosyvoice, bark) y asr (whisper, whisperx).
* desarrollar métricas internas de evaluación de diálogo (inteligibilidad, empatía, consistencia contextual).
* monitorear el desempeño de los modelos en producción y aplicar técnicas de feedback-based optimization.
* colaborar en la definición de nuevas funcionalidades de agentes de voz, incluyendo integración con telefonía o webrtc.
oportunidades de desarrollo:
* desarrollar modelos de voz personalizados y comprender la arquitectura de sistemas speech-speech real-time.
* trabajar con tecnologías de vanguardia: whisperx, pipertts, gpt-4o, gemini 1.5 pro, langgraph, y motores de inferencia acelerados (groq, onnx runtime).
* diseñar prompt stacks y context planners para agentes autónomos conversacionales.
* participar en proyectos que combinan ia generativa, emociones y conversación natural, con impacto directo en miles de usuarios.
además, tendrás la responsabilidad de investigar y proponer las mejores herramientas y técnicas para optimizar los procesos de análisis y documentación.
ambiente de trabajo:
formarás parte de un equipo especializado en ia generativa aplicada a voz y lenguaje, con alto nivel técnico y enfoque ético.
promovemos un entorno de aprendizaje constante, colaboración abierta y responsabilidad compartida.
tendrás autonomía técnica y apoyo continuo para impulsar tus ideas hacia producción.
únete a nuestro equipo
queremos que formes parte de nuestro talentoso equipo de profesionales aprovecha esta oportunidad para desarrollar tus habilidades y crecer profesionalmente en un ambiente dinámico y colaborativo.
requirements
este rol es ideal para un profesional con experiencia en ia conversacional, síntesis y comprensión del habla, que desee construir agentes de voz inteligentes y autónomos.
buscamos a alguien que disfrute diseñar experiencias naturales entre humanos y máquinas, dominando tanto la parte técnica como la creatividad aplicada al diseño de conversación.
habilidades y competencias requeridas:
* dominio avanzado de python y experiencia en desarrollo de apis restful o websocket.
* experiencia práctica con tecnologías de openai, whisper, pipertts, langchain, langgraph, autogen o similares.
* conocimientos sólidos en procesamiento de audio, diarización, embeddings de voz y voice activity detection (vad).
* experiencia en mlops (docker, entornos virtuales, mlflow, dvc, control de versiones de modelos).
* experiencia comprobable en despliegue de modelos speech o generativos en entornos reales (mínimo 2 años).
* habilidad para analizar resultados de modelos generativos y proponer mejoras cuantitativas y cualitativas.
* capacidad para trabajar en equipo multidisciplinario, con criterio técnico y comunicación efectiva.
benefits
sueldo competitivo
prestaciones de ley y superiores
ambiente de trabajo colaborativo y de aprendizaje
licenciatura en ia o afin