Job Description
Buscamos uma pessoa SRE Pleno para apoiar a confiabilidade, disponibilidade e performance dos nossos sistemas e serviços, atuando de forma próxima aos times de desenvolvimento e operações, com foco em observabilidade, automação e resposta a incidentes.
Responsabilidades
- Apoiar a confiabilidade, disponibilidade e performance dos sistemas e serviços;
- Atuar no monitoramento e observabilidade, identificando falhas e degradações de serviço;
- Apoiar a resposta a incidentes, participando de análises de causa raiz e definição de ações corretivas;
- Implementar automações e melhorias para reduzir falhas recorrentes e diminuir o toil operacional;
- Apoiar a evolução dos pipelines de CI/CD, com foco em estabilidade, rastreabilidade e boas práticas de release;
- Contribuir com a instrumentação de sistemas (logs, métricas e tracing);
- Documentar processos, padrões operacionais e runbooks.
Requisitos Técnicos
<...Apply for this Position
Ready to join UpFlux? Click the button below to submit your application.
Submit Application