Site Reliability Engineer – Senior

Posted 6hrs ago

Employment Information

Education
Salary
Experience
Job Type

Report this job

Job expired or something wrong with this job?

Job Description

Site Reliability Engineer ensuring application availability and performance for Grupo SysMap, a tech company focused on digital transformation in various sectors.

Responsibilities:

  • Garantir a disponibilidade, escalabilidade e desempenho das aplicações e serviços;
  • Implementar e evoluir práticas de **observabilidade**, incluindo métricas, logs e traces;
  • Criar e manter **dashboards (dashs)** para acompanhamento de indicadores de saúde dos sistemas;
  • Definir e gerenciar **alarmísticas**, com foco em alertas eficientes e redução de ruído;
  • Atuar na identificação e resolução de incidentes, realizando análise de causa raiz (RCA);
  • Trabalhar em conjunto com times de desenvolvimento para melhoria contínua (DevOps);
  • Automatizar rotinas operacionais e processos de monitoração;
  • Apoiar a definição e acompanhamento de SLIs, SLOs e SLAs;
  • Contribuir para a cultura de confiabilidade e engenharia de resiliência.

Requirements:

  • Experiência com práticas de **SRE/DevOps**;
  • Conhecimento sólido em **observabilidade** (monitoramento, logging e tracing);
  • Experiência na construção de **dashboards e visualização de dados operacionais**;
  • Experiência com **gestão de alertas (alarmísticas)**;
  • Vivência com ferramentas de monitoramento e observabilidade, como:
  • Elastic Stack (Elasticsearch, Logstash, Kibana);
  • Datadog;
  • Splunk;
  • Dynatrace;
  • Conhecimento em ambientes cloud (AWS, Azure ou GCP);
  • Experiência com automação (Python, Shell Script ou similares);
  • Conhecimento em sistemas Linux e redes;
  • Experiência com containers e orquestração (Docker/Kubernetes);
  • Experiência com ferramentas de APM (Application Performance Monitoring);
  • Conhecimento em infraestrutura como código (Terraform, CloudFormation);
  • Experiência com pipelines CI/CD;
  • Conhecimento em práticas de Chaos Engineering;
  • Certificações em cloud ou SRE;
  • Experiência com cultura de observabilidade orientada a negócio.

Benefits:

  • null