Unicred do Brasil
OPERAÇÕES DE TI
Tático
Analista de Monitoramento e Observabilidade Sr
Missão do Cargo
- Liderar a concepção e implementação de estratégias de monitoramento e observabilidade, garantindo a visibilidade completa e proativa da saúde dos sistemas;
- Atuar como referência técnica, mentorando a equipe e influenciando a adoção de melhores práticas para elevar a confiabilidade e a performance das aplicações.
Principais Responsabilidades
- Definir e arquitetar a estratégia de monitoramento e observabilidade para ambientes complexos e distribuídos;
- Liderar a implementação e otimização de plataformas de observabilidade, integrando diversas fontes de dados (métricas, logs, traces);
- Realizar análises preditivas e proativas, identificando gargalos e potenciais problemas antes que afetem os usuários;
- Desenvolver e promover padrões de instrumentação e observabilidade para os times de desenvolvimento;
- Mentorar analistas juniores e plenos, compartilhando conhecimento e promovendo o desenvolvimento técnico;
- Atuar como especialista em análise de causa raiz de incidentes complexos, coordenando a resolução e a implementação de ações corretivas e preventivas;
- Pesquisar e avaliar novas tecnologias e tendências em monitoramento e observabilidade, propondo sua adoção;
- Definir e monitorar KPIs e métricas de observabilidade, apresentando insights e recomendações para a gestão;
- Colaborar ativamente com os times de SRE e DevOps para garantir a confiabilidade e a eficiência operacional.
Formação mínima desejável
- Curso superior em áreas correlatas à Tecnologia da Informação;
- Desejável Pós-graduação em áreas de TI ou gestão.
Conhecimento técnico desejável
- Domínio em arquitetura de observabilidade (OpenTelemetry, Jaeger, Prometheus, Grafana, Dynatrace);
- Domínio em análise de dados, com expertise em análise de grandes volumes de logs e métricas, utilizando ferramentas e técnicas avançadas;
- Domínio em cloud computing, com monitoramento e observabilidade em ambientes de nuvem (AWS, Azure, GCP) e arquiteturas cloud-native;
- Proficiência em automação, com scripting em Python e Go para automação de tarefas de observabilidade e integração de sistemas;
- Conhecimento aprofundado em SRE e DevOps, entendendo como a observabilidade suporta confiabilidade e entrega contínua;
- Domínio em redes, especializado em monitoramento de redes complexas e segurança de rede.
Carreiras
Conheça outros cargos
01
/
04