Generative ai engineer senior

Cuauhtémoc, D.F.

CREAI

Publicada el 10 abril

Descripción

Sobre creai en creai, nos especializamos en aprovechar el poder de la inteligencia artificial y el aprendizaje automático para transformar negocios. Nuestra misión es ayudar a los clientes a reducir costos, aumentar la eficiencia y desbloquear nuevas oportunidades mediante soluciones de ia de vanguardia. Descripción del puesto como senior generative ai software engineer en creai, serás responsable de diseñar, implementar y mantener soluciones empresariales complejas basadas en inteligencia artificial generativa, large language models (llm) y retrieval-augmented generation (rag). Este rol requiere expertise técnico profundo en el ciclo completo de vida de proyectos genai, desde el discovery inicial hasta el despliegue en producción y optimización continua. Serás el guardián de la calidad y robustez de nuestras soluciones genai, liderando la implementación de nuestra metodología estandarizada y asegurando que cada sistema entregue valor real de negocio mientras mantiene los más altos estándares de precisión, seguridad y eficiencia de costos. Trabajarás directamente con clientes enterprise para traducir problemas de negocio complejos en arquitecturas genai escalables y confiables. Requisitos y competencias (detalle técnico) experiencia profunda en genai/llm: 3+ años de experiencia práctica diseñando e implementando soluciones de producción basadas en llms, incluyendo sistemas rag, agentes conversacionales y generación de contenido. Experiencia comprobada llevando proyectos desde discovery hasta producción. Dominio de frameworks y herramientas: experiencia avanzada con langchain, llamaindex o similares. Conocimiento profundo de plataformas (openai api, anthropic claude, google gemini) y sus capacidades de function calling, structured outputs y json mode. Expertise en sistemas rag: arquitecturas completas incluyendo document processing, chunking strategies, embedding models (openai, sentence-transformers), vectorstores (pinecone, chroma, weaviate, pgvector), y retrieval strategies (semantic search, hybrid search, re-ranking). Prompt engineering avanzado: diseño y optimización de prompts complejos (few-shot, chain-of-thought, react). Implementación de guardrails contra alucinaciones, incluyendo grounding, citation enforcement y validation post-processing. Orquestación de agentes: familiaridad con frameworks multi-agente como autogen, crewai o langgraph. Desarrollo de software y arquitectura: sólidas habilidades en python; patrones arquitectónicos (microservicios, event-driven), apis restful y mejores prácticas (testing, ci/cd, version control). Mlops y despliegue: pipelines de ml en producción, model serving, monitoring, logging y continuous evaluation. Manejo de docker, kubernetes e infraestructura como código (terraform). Plataformas cloud: experiencia práctica en aws (bedrock, sagemaker), google cloud (vertex ai) o azure (openai service). Data engineering: procesamiento de datos no estructurados (pdfs, html), estructurados y semi-estructurados. Conocimiento de etl/elt y herramientas como pandas o apache spark. Evaluación y testing: implementación de frameworks de evaluación con métricas automáticas y humanas. Conocimiento de métricas de retrieval (precision, recall, mrr, ndcg) y de generación (bleu, rouge, bertscore). Seguridad y compliance: prompt injection defense, pii protection, access control y auditoría. Familiaridad con gdpr/ccpa. Habilidades consultivas: comunicación técnica excepcional para audiencias diversas y stakeholders ejecutivos. Mentalidad de producto enfocada en roi y valor al cliente. Experiencia en sesiones de discovery y manejo de expectativas. Idioma: inglés avanzado (técnico, verbal y escrito). Habilidades deseables modelos open-source (llama 3, mistral, falcon) y despliegues self-hosted (vllm, tgi, ollama). Técnicas avanzadas de rag: hyde, query decomposition, multi-query retrieval, parent document retrieval y contextual compression. Fine-tuning de llms (lora, qlora, peft). Implementación de graphrag o knowledge graphs. Optimización de modelos: quantization (gguf, gptq) para reducción de latencia y costos. Observabilidad especializada: langfuse, langsmith, weights & biases (w&b), arize o phoenix. Certificaciones cloud (aws solutions architect, google cloud professional ml engineer) o específicas de genai. Background en research de nlp/ml o contribuciones open-source. Ia responsable: fairness testing, bias detection, explainability y gobernanza. Optimización avanzada de prompts: dspy, automatic prompt engineering o compression. Modelos multimodales: gpt-4 vision, gemini pro vision, claude 3 (imagen, audio, video). Beneficios pto ilimitado: gestión efectiva de tu propio tiempo. Desarrollo profesional: presupuesto anual para cursos, certificaciones y conferencias. Equipamiento: presupuesto para configurar tu espacio de trabajo remoto ideal. Incentivos: bonos semestrales por desempeño. Salud: beneficio de salud privada o subsidios para seguro médico. Crecimiento: plan de carrera y mentoría con expertos en ia. Cultura: ambiente startup dinámico, flexible y enfocado en resultados. Balance: prioridad al bienestar y flexibilidad horaria. Modalidad: remoto o híbrido (a negociar). Esta vacante viene de la bolsa de empleo talenteca.com:

Aplicar

Crear una alerta

Guardar