Descripción
en bankaya, la *confiabilidad es nuestro producto*. Como plataforma de _banking as a service (baas)_, buscamos a un/a *lead site reliability engineer (sre)* que combine liderazgo técnico, visión estratégica y pasión por la estabilidad a gran escala.
*tu impacto*:
- serás el/la *líder técnico en incidentes críticos (p0)*, garantizando comunicación clara y soluciones efectivas con equipos internos y socios bancarios.
- diseñarás e implementarás *patrones de resiliencia* (circuit breakers, rate limits, timeouts) para que nuestra plataforma sea más rápida, escalable y confiable.
- impulsarás una *cultura de mejora continua*, liderando postmortems blameless y asegurando que cada incidente deje aprendizajes reales.
- transformarás métricas y logs (prometheus, efk, betterstack, sentry, android vitals) en *acciones concretas para mejorar la estabilidad*.
*nuestro stack*:
- * cloud (principal)*: gcp (gke, istio, prometheus, efk, grafana on-call).
- * db & storage*: aws (s3, rds mysql, dynamodb, aurora).
- * infra adicional*: aws lambdas, nginx para conexiones con socios.
- * apps móviles*: react native, monitoreo con sentry y android vitals.
- * integraciones*: vpn con sistemas on-premise (rest/soap) de socios bancarios.
*lo que buscamos en ti*:
- experiência *senior* como sre, devops o platform engineer en entornos de misión crítica.
- dominio profundo en *kubernetes (gke)* y observabilidad con prometheus, grafana y elk/efk.
- experiência liderando *respuestas a incidentes críticos (p0)* con calma bajo presión.
- conocimiento sólido en patrones de confiabilidad (_circuit breakers, retries, rate limiting_).
- manejo experto en *infraestructura gcp* (indispensable) y aws (deseable).
- excelentes habilidades de comunicación para interactuar con devs, sysadmins y socios externos.
*plus que nos encantaría ver*:
- experiência con istio u otros service mesh.
- observabilidad en aplicaciones móviles (sentry, android vitals).
- optimización de rendimiento en java/jvm.
- experiência en *fintech / baas*.
Si buscas liderar la confiabilidad de una plataforma financiera de alto impacto y resolver desafíos complejos a escala, este rol es para ti.