Job Description

En ACKstorm estamos buscando un/a Site Reliability Engineer (SRE) con experiencia en AWS y Google Cloud Platform (GCP) para unirse a uno de nuestros squads del equipo de Cloud Operations Engineering. La persona seleccionada será responsable de garantizar la fiabilidad, escalabilidad, seguridad y observabilidad de plataformas críticas en entornos cloud y Kubernetes.

Responsabilidades

  • Diseñar, operar y evolucionar plataformas escalables y de alta disponibilidad en AWS y GCP.
  • Operar y optimizar entornos Kubernetes en producción (EKS, GKE).
  • Gestionar y resolver incidencias y casos de alta complejidad .
  • Participar en guardias / on-call , según la rotación establecida.
  • Gestionar incidentes críticos , realizar postmortems y definir acciones de mejora continua.
  • Implementar y mantener soluc...

Apply for this Position

Ready to join ACKstorm? Click the button below to submit your application.

Submit Application