 
        
        En bankaya, la confiabilidad es nuestro producto.
como plataforma de banking as a service (baas), buscamos a un/a lead site reliability engineer (sre) que combine liderazgo técnico, visión estratégica y pasión por la estabilidad a gran escala.
tu impacto
serás el/la líder técnico en incidentes críticos (p0), garantizando comunicación clara y soluciones efectivas con equipos internos y socios bancarios.
diseñarás e implementarás patrones de resiliencia (circuit breakers, rate limits, timeouts) para que nuestra plataforma sea más rápida, escalable y confiable.
impulsarás una cultura de mejora continua, liderando postmortems blameless y asegurando que cada incidente deje aprendizajes reales.
transformarás métricas y logs (prometheus, efk, betterstack, sentry, android vitals) en acciones concretas para mejorar la estabilidad.
nuestro stack
cloud (principal): gcp (gke, istio, prometheus, efk, grafana on-call).
db & storage: aws (s3, rds mysql, dynamodb, aurora).
infra adicional: aws lambdas, nginx para conexiones con socios.
apps móviles: react native, monitoreo con sentry y android vitals.
integraciones: vpn con sistemas on-premise (rest/soap) de socios bancarios.
lo que buscamos en ti
experiencia senior como sre, devops o platform engineer en entornos de misión crítica.
dominio profundo en kubernetes (gke) y observabilidad con prometheus, grafana y elk/efk.
experiencia liderando respuestas a incidentes críticos (p0) con calma bajo presión.
conocimiento sólido en patrones de confiabilidad (circuit breakers, retries, rate limiting).
manejo experto en infraestructura gcp (indispensable) y aws (deseable).
excelentes habilidades de comunicación para interactuar con devs, sysadmins y socios externos.
plus que nos encantaría ver
experiencia con istio u otros service mesh.
observabilidad en aplicaciones móviles (sentry, android vitals).
optimización de rendimiento en java/jvm.
experiencia en fintech / baas.
si buscas liderar la confiabilidad de una plataforma financiera de alto impacto y resolver desafíos complejos a escala, este rol es para ti.
¡sé parte de la innovación como site reliability engineer / devops engineer!
ingeniero de sistemas - ciudad de méxico
azcapotzalco, mexico city, mexico
2 days ago
#j-*-ljbffr