Generative ai engineer

Casa Blanca, Pue

Layer7 SAPI de CV

De USD 180,000 a USD 250,000 al año

Publicada el 10 octubre

Descripción

This is a remote position.

sobre layer7:

en layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas.

somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.

aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida personal y profesional.

si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar.

responsabilidades del puesto:

como generative ai engineer de nivel medio, tu misión será diseñar, entrenar e implementar sistemas conversacionales que integren voz, texto y contexto. Trabajarás en estrecha colaboración con los equipos de producto, ingeniería y ciencia de datos, contribuyendo al desarrollo de un pipeline completo de speech-to-speech ai agents.

tus principales responsabilidades incluirán:

* diseñar, implementar y optimizar agentes de voz basados en modelos de lenguaje grande (llms) y modelos de voz (tts/stt).

* desarrollar pipelines de conversación continua (speech text llm speech) con foco en latencia baja y naturalidad de respuesta.

* aplicar técnicas de prompt engineering y context management para mantener coherencia, memoria conversacional y control de tono.

* integrar modelos generativos en entornos backend (fastapi, langchain, langgraph, autogen o equivalentes).

* afinar y evaluar modelos multimodales, incluyendo fine-tuning de tts (pipertts, cosyvoice, bark) y asr (whisper, whisperx).

* desarrollar métricas internas de evaluación de diálogo (inteligibilidad, empatía, consistencia contextual).

* monitorear el desempeño de los modelos en producción y aplicar técnicas de feedback-based optimization.

* colaborar en la definición de nuevas funcionalidades de agentes de voz, incluyendo integración con telefonía o webrtc.

oportunidades de desarrollo:

* desarrollar modelos de voz personalizados y comprender la arquitectura de sistemas speech-speech real-time.

* trabajar con tecnologías de vanguardia: whisperx, pipertts, gpt-4o, gemini 1.5 pro, langgraph, y motores de inferencia acelerados (groq, onnx runtime).

* diseñar prompt stacks y context planners para agentes autónomos conversacionales.

* participar en proyectos que combinan ia generativa, emociones y conversación natural, con impacto directo en miles de usuarios.

además, tendrás la responsabilidad de investigar y proponer las mejores herramientas y técnicas para optimizar los procesos de análisis y documentación.

ambiente de trabajo:

formarás parte de un equipo especializado en ia generativa aplicada a voz y lenguaje, con alto nivel técnico y enfoque ético.

promovemos un entorno de aprendizaje constante, colaboración abierta y responsabilidad compartida.

tendrás autonomía técnica y apoyo continuo para impulsar tus ideas hacia producción.

únete a nuestro equipo

queremos que formes parte de nuestro talentoso equipo de profesionales aprovecha esta oportunidad para desarrollar tus habilidades y crecer profesionalmente en un ambiente dinámico y colaborativo.

requirements

este rol es ideal para un profesional con experiencia en ia conversacional, síntesis y comprensión del habla, que desee construir agentes de voz inteligentes y autónomos.

buscamos a alguien que disfrute diseñar experiencias naturales entre humanos y máquinas, dominando tanto la parte técnica como la creatividad aplicada al diseño de conversación.

habilidades y competencias requeridas:

* dominio avanzado de python y experiencia en desarrollo de apis restful o websocket.

* experiencia práctica con tecnologías de openai, whisper, pipertts, langchain, langgraph, autogen o similares.

* conocimientos sólidos en procesamiento de audio, diarización, embeddings de voz y voice activity detection (vad).

* experiencia en mlops (docker, entornos virtuales, mlflow, dvc, control de versiones de modelos).

* experiencia comprobable en despliegue de modelos speech o generativos en entornos reales (mínimo 2 años).

* habilidad para analizar resultados de modelos generativos y proponer mejoras cuantitativas y cualitativas.

* capacidad para trabajar en equipo multidisciplinario, con criterio técnico y comunicación efectiva.

benefits

sueldo competitivo

prestaciones de ley y superiores

ambiente de trabajo colaborativo y de aprendizaje

licenciatura en ia o afin

Aplicar

Crear una alerta

Guardar