Ubicación
este rol está disponible para trabajo remoto desde méxico, chile, argentina, colombia, uruguay y perú.
Resumen
únete a nuestro equipo de site reliability engineering como observability engineer, donde implementamos y optimizamos herramientas que permiten un monitoreo automatizado y eficiente, proporcionando la información necesaria para corregir errores y asegurar en todo momento el correcto funcionamiento de nuestros productos en la nube en ambientes productivos. Tendrás el desafío de garantizar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores de desempeño de las plataformas para garantizar la continuidad de la operación de grandes centros de datos, que soportan las aplicaciones e infraestructura críticas e ininterrumpidas que desplegamos.
Responsabilidades
diseñar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud
definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos
asegurar el correcto funcionamiento de clouds productivos basados en tecnologías open source (como kubernetes y openstack)
atender las incidencias críticas de la plataforma, escalando a los ingenieros senior o al área de desarrollo de productos
requisitos técnicos
formación
estudios de ingeniería informática, ingeniería de sistemas, computación o título afín
experiencia
experiencia relacionada de al menos 3 años en cargos relacionados con la gestión, optimización y monitoreo de infraestructuras en la nube, especialmente con tecnologías como kubernetes y/o openstack, y el manejo de incidencias y entornos productivos
experiencia en el diseño y soluciones de monitoreo para infraestructuras cloud, así como gestión del desempeño y coordinación de incidencias críticas con el equipo de desarrollo
conocimientos específicos / requisitos técnicos
linux intermedio: comandos básicos, manipulación de archivos, red, etc.
Experiencia con shell scripting (bash)
automatización (scripting) con bash y/o python
git: nivel básico (conoce el flujo add, commit, push; no interviene en rebase o cherry-pick)
uso y creación de imágenes de contenedores con docker (intermedio)
uso y configuración de herramientas de monitoreo (prometheus, grafana, elasticsearch, kibana)
uso y configuración de herramientas de despliegue como gitlab, argocd, etc.
Conocimiento en monitorear elementos externos como routers, switches, clusters de kubernetes, vms
uso y administración de clusters de kubernetes
idioma: inglés intermedio (escritura/lectura)
deseables
experiencia cloud público (aws, gcp, azure) o privado (openstack)
experiencia en metodologías ágiles (scrum, kanban, etc.)
Capacidad de adaptar open-source existente
certificaciones en linux, openstack y/o kubernetes
integración de proyectos de código abierto
conocimientos básicos en networking
soft-skills requeridos
autonomía, disciplina y capacidad autoaprendizaje
pensamiento analítico conceptual
orientación al cliente
saber trabajar en equipo
sobre nosotros
en whitestack somos líderes en latinoamérica en el desarrollo de soluciones telco cloud, open networking e infraestructura digital híper‑escalable. Trabajamos con tecnologías de código abierto como openstack, kubernetes, open source mano, ceph, prometheus, onos y muchas otras y colaboramos activamente con organizaciones globales como etsi, la open infrastructure foundation, el telecom infra project y el open compute project. Impulsamos la transformación digital en la región mediante estándares de clase mundial, grandes implementaciones para operadores y un fuerte compromiso con la innovación.
Además, somos un great place to work, donde la colaboración y el desarrollo personal son parte esencial de nuestra cultura.
¿por qué unirte a whitestack?
Proyección internacional: participa en iniciativas globales y viaja para colaborar con equipos en distintos países
⚖️ equilibrio real: diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito
crecimiento claro: te ofrecemos una línea de carrera sólida en liderazgo y tecnología
salud primero: seguro médico privado para ti y tu familia
aprendizaje sin límites: acceso a cursos, libros, materiales y reembolso de certificaciones
idiomas para el mundo: cursos de idiomas para que tu crecimiento no tenga fronteras
tecnología en tus manos: renovamos tu equipo cada 3 años... ¡y es tuyo al finalizar el período
reconocimiento al esfuerzo: bonos por rendimiento y éxito en proyectos
tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de fiestas patrias, navidad y año nuevo