Estamos formando un equipo seleccionado para construir una solución tecnológica innovadora en latinoamérica.
desarrollamos inteligencia artificial de frontera enfocada en procesamiento de texto en español, atendiendo a un problema real con clientes listos para la implementación.si tienes pasión por la optimización de algoritmos, la depuración de código y ver cómo una curva de pérdida finalmente converge, eres la persona que buscamos.diseñarás y ejecutarás el pipeline completo: corpus, continual pre-training (cpt), supervised fine-tuning (sft), rlhf, cuantización y despliegue en hardware propietario.
ofrecemos un entorno con alta autonomía, responsabilidad y un desafío técnico avanzado.funciones principales:preparar y tokenizar conjuntos de datos de texto en español a gran escala.ejecutar continual pre-training sobre modelos base de código abierto en infraestructura de gpus dedicadas.realizar ajuste fino supervisado (fine-tuning) con lora y qlora utilizando el ecosistema de huggingface y trl.diseñar y operar pipelines de rlhf y dpo con anotadores de dominio.cuantizar el modelo final para despliegue local (on-premise) utilizando gguf y mlx en hardware específico.construir sistemas de recuperación de información (rag) sobre pgvector.diseñar métricas de evaluación rigurosas para la validación de los modelos.requisitos indispensables:dominio avanzado de python.experiencia práctica demostrable con pytorch y huggingface transformers.experiencia en fine-tuning de llms en entornos de producción (sft, lora, qlora).
manejo fluido de entornos linux mediante línea de comandos.experiencia en gestión de grandes volúmenes de datos (procesos etl, tokenización y pipelines).
dominio nativo u operativo avanzado (c2) del idioma español para la evaluación de textos.requisitos deseables:conocimiento de mlx para apple silicon.experiencia con rlhf, dpo y reward modeling.manejo de herramientas como unsloth, deepspeed o fsdp.conocimientos en cuantización: gguf, gptq, awq.experiencia con pgvector o bases de datos vectoriales.familiaridad con llama.cpp y ollama.ofrecemos:sueldo competitivo acorde a la experiencia técnica demostrada.prestaciones superiores a las de la ley.infraestructura y hardware dedicado para el entrenamiento de modelos.rol fundacional con impacto directo en las decisiones de arquitectura.flexibilidad de horario basada en el cumplimiento de objetivos.proceso de selección:por políticas de la plataforma, favor de postularse directamente a través del botón de este portal manteniendo actualizado tu perfil, incluyendo tu portafolio o enlaces a repositorios de código relevantes (proyectos de fine-tuning o entrenamiento) en tu información adjunta.
el código demostrable será evaluado en las primeras etapas del proceso.
-requerimientos- educación mínima: educación superior - especialidad4 años de experienciaidiomas: español ,inglésedad: entre 30 y 40 añosconocimientos: backend, base de datos, inteligencia artificial, java, optimización, python, spring, soluciones tecnológicas