Descripcion del puesto
buscamos a un experto en resiliencia de sistemas para potencialmente sumarse a un proyecto de consultoría.
el rol tendrá como objetivo fortalecer la confiabilidad, estabilidad y resiliencia de los sistemas críticos, guiando el diseño e implementación de un modelo operativo sre basado en las prácticas de google y el marco calms.
">
responsabilidades
* diseñar y adaptar el modelo operativo sre al contexto de la organización.
* relevar flujos críticos, dependencias y puntos de falla en sistemas clave.
* definir y mantener el catálogo de servicios sre (incidentes, postmortems, observabilidad, capacity planning, error budgets).
* estandarizar procesos de despliegue y cambios en entornos multicloud (aws, oci, otros).
* integrar métricas técnicas con impacto de negocio.
* colaborar con equipos de consultoría, calidad y change management para asegurar una implementación transversal y sostenible.
* impulsar la adopción cultural de prácticas de confiabilidad mediante comunicación, capacitación y gestión del conocimiento.
* acompañar la ejecución de postmortems y planes de mejora continua.
* apoyar la capacitación práctica de equipos de monitoreo y soporte.
">
requisitos y calificaciones
* +5 años en roles de sre o confiabilidad en entornos críticos (idealmente banca/finanzas).
* experiencia en gestión de incidentes de alta criticidad y definición de procesos de estabilidad.
* conocimiento profundo en observabilidad (dynatrace, prometheus, opentelemetry, etc.) y correlación de métricas.
* experiencia en automatización de despliegues, pruebas de regresión y frameworks ci/cd.
* capacidad demostrada de traducir métricas técnicas en impacto de negocio y de liderar procesos de cambio cultural hacia la confiabilidad.
* capacidad para entender el negocio del cliente y lo traducirlo en decisiones de sre.
* capacidad para generar documentación clara y ejecutiva (mapas de arquitectura, modelos de equipo, roadmaps, etc.).
* excelente comunicación para interactuar con perfiles técnicos y no técnicos.
certificaciones deseables:
* cloud (aws / oci / multicloud)
* aws certified solutions architect – professional
* aws certified devops engineer – professional
* aws certified advanced networking – specialty
* oracle cloud infrastructure (oci)
* architect professional (opcional, por presencia de oci en el entorno)
* dynatrace associate / professional certification
* prometheus certified associate (cncf)
* google professional cloud devops engineer
* kubernetes certified administrator (cka) o certified kubernetes application developer (ckad)
* hashicorp terraform associate
* sre foundation (devops institute)
* sre practitioner (para reforzar el marco cultural y de procesos)
* itil 4 specialist: high velocity it
si te interesa este puesto y cumplís con los requisitos, no dudes en postularte a fin de que podamos contactarte para compartirte más detalles.