Descripción del puesto
buscamos a un experto en ingeniería de confiabilidad y automatización para garantizar la alta disponibilidad, escalabilidad y rendimiento de nuestros sistemas y aplicaciones.
responsabilidades
* diseñar, implementar y mantener sistemas escalables y fiables mediante la automatización de tareas operativas y la resolución de problemas tecnológicos.
* realizar el trabajo que tradicionalmente hacían las operaciones, pero utilizando ingenieros con experiencia en software para resolver problemas complejos.
* ejecutar y mejorar el proceso de gestión de incidencias, garantizando el tiempo de actividad de todos los servicios y procesos.
requisitos
* licenciatura en ciencias de la computación, ingeniería de software o similar.
* experiencia en herramientas de observabilidad y monitorización como new relic, data dog, cloudwatch, opsgenie, pagerduty.
* conocimiento profundo del entorno multicuenta de aws, con estrategia centralizada de observabilidad y monitorización.
* capacidad de programación (scripting) utilizando uno o más lenguajes de alto nivel como python, golang, rust, javascript.
* experiencia práctica con soluciones de microservicios, incluidos contenedores y cargas de trabajo de funciones.
* experiencia en el diseño, la implementación y el mantenimiento de objetivos de nivel de servicio (slo) para garantizar el tiempo de actividad y el rendimiento del servicio.
* comprensión de las técnicas de saneamiento de telemetría y experiencia en la aplicación de estas técnicas de conformidad con los requisitos reglamentarios y de seguridad.
beneficios
* ambiente de trabajo dinámico y colaborativo.
* oportunidades para aprender y crecer profesionalmente.
* equipo apasionado y talentoso.
* paquete de compensación competitivo y beneficios atractivos.
* oportunidad de impactar positivamente en la vida de miles de personas.