Job Description
En ACKstorm estamos buscando un/a Site Reliability Engineer (SRE) con experiencia en AWS y Google Cloud Platform (GCP) para unirse a uno de nuestros squads del equipo de Cloud Operations Engineering. La persona seleccionada será responsable de garantizar la fiabilidad, escalabilidad, seguridad y observabilidad de plataformas críticas en entornos cloud y Kubernetes.
Responsabilidades
- Diseñar, operar y evolucionar plataformas escalables y de alta disponibilidad en AWS y GCP.
- Operar y optimizar entornos Kubernetes en producción (EKS, GKE).
- Gestionar y resolver incidencias y casos de alta complejidad .
- Participar en guardias / on-call , según la rotación establecida.
- Gestionar incidentes críticos , realizar postmortems y definir acciones de mejora continua.
- Implementar y mantener soluc...
Apply for this Position
Ready to join ACKstorm? Click the button below to submit your application.
Submit Application