Easy Hunter

Site Reliability Engineer (Engenheiro de Confiabilidade de Site) – SRE

Use este modelo de descrição do trabalho para atrair e contratar candidatos qualificados para o seu departamento de TI. Fique à vontade para modificá-lo com as atribuições e responsabilidades inerentes à função e de acordo com as necessidades de sua empresa.

O que é um Site Reliability Engineer (SRE)?

Um Site Reliability Engineer (SRE) é um profissional de tecnologia da informação (TI) que desempenha um papel crítico na garantia da confiabilidade, disponibilidade e desempenho de sistemas, aplicativos e serviços online. A função de SRE combina princípios de engenharia de software com práticas de operações de sistemas para criar sistemas altamente escaláveis e confiáveis.

Descrição da vaga

Estamos procurando um Site Reliability Engineer altamente qualificado e apaixonado por garantir a confiabilidade e disponibilidade de nossos sistemas e serviços. O candidato ideal terá experiência em operações de produção e um profundo entendimento de infraestrutura, automação e monitoramento. Se você é motivado por manter sistemas em funcionamento de forma eficiente e busca uma oportunidade desafiadora como Engenheiro de Confiabilidade de Sites, esta vaga é para você.

Responsabilidades

  • Projetar, desenvolver e manter infraestruturas escaláveis e altamente disponíveis.
  • Implementar automação para facilitar implantações, monitoramento e recuperação de falhas.
  • Realizar análise de causa raiz de incidentes e implementar melhorias preventivas.
  • Colaborar com equipes de desenvolvimento para garantir que os sistemas sejam altamente confiáveis e de alto desempenho.
  • Estabelecer práticas de monitoramento e alerta para identificar e resolver problemas proativamente.
  • Participar de atividades de planejamento de capacidade para dimensionar recursos conforme necessário.
  • Ficar atualizado sobre as melhores práticas e tendências em engenharia de confiabilidade de sites.

Requisitos obrigatórios

  • Experiência comprovada em engenharia de confiabilidade de sites (SRE) ou operações de produção.
  • Conhecimento sólido em sistemas Linux e administração de servidores.
  • Experiência em automação de infraestrutura usando ferramentas como Terraform, Ansible ou similares.
  • Habilidades de programação em uma ou mais linguagens, como Python, Go, ou Ruby.
  • Familiaridade com ferramentas de monitoramento, como Prometheus, Grafana ou similares.
  • Formação acadêmica em Ciência da Computação, Engenharia de Sistemas ou área relacionada.

Diferenciais

  • Experiência em ambientes de nuvem, como AWS, Azure ou Google Cloud.
  • Conhecimento em containers e orquestração, como Docker e Kubernetes.
  • Experiência em implantações de alta disponibilidade e tolerância a falhas.
  • Certificações em SRE ou infraestrutura como código.

Formação, cursos e certificações

  • Cursos de formação em SRE ou automação de infraestrutura são valorizados.
  • Certificações relevantes em engenharia de confiabilidade de sites são um diferencial.

Benefícios

  • Salário competitivo.
  • Oportunidades de desenvolvimento profissional e treinamento contínuo.
  • Ambiente de trabalho colaborativo e inovador.
  • Projetos desafiadores e impactantes.
  • Plano de saúde e odontológico.
  • Horário flexível e opções de trabalho remoto.

CBO: 2122-05