Job Description
Responsabilidades
- Observabilidad avanzada de logs, eventos, métricas y dashboards en herramientas de monitoreo (Datadog/Grafana).
- Análisis, correlación y priorización de alertas e Incidentes.
- Coordinación y ejecución de escalamientos técnicos con equipos resolutores internos y proveedores.
- Gestión integral de Incidentes, problemas y requisiciones, asegurando cumplimiento de SLA y SLO.
- Liderar y coordinar war rooms para incidentes críticos (P1).
- Registro, seguimiento y documentación de Incidentes en herramientas de ITSM (Jira Service Management / Atlassian).
- Elaboración y seguimiento de informes post mortem y planes de mejora.
- Acompañamiento, comunicación y validación de mantenimientos programados y emergentes.
- Gestión y actualización de Status Page y comunicaciones con stakeholders.
- Definición, revisión y ejecución de checklists operativos.
- Actualización de documentaciones, pro...
Apply for this Position
Ready to join Ripio? Click the button below to submit your application.
Submit Application