Job Description

Responsabilidades

  • Observabilidad avanzada de logs, eventos, métricas y dashboards en herramientas de monitoreo (Datadog/Grafana).
  • Análisis, correlación y priorización de alertas e Incidentes.
  • Coordinación y ejecución de escalamientos técnicos con equipos resolutores internos y proveedores.
  • Gestión integral de Incidentes, problemas y requisiciones, asegurando cumplimiento de SLA y SLO.
  • Liderar y coordinar war rooms para incidentes críticos (P1).
  • Registro, seguimiento y documentación de Incidentes en herramientas de ITSM (Jira Service Management / Atlassian).
  • Elaboración y seguimiento de informes post mortem y planes de mejora.
  • Acompañamiento, comunicación y validación de mantenimientos programados y emergentes.
  • Gestión y actualización de Status Page y comunicaciones con stakeholders.
  • Definición, revisión y ejecución de checklists operativos.
  • Actualización de documentaciones, pro...

Apply for this Position

Ready to join Ripio? Click the button below to submit your application.

Submit Application