Talent.com
A vaga não está disponível no seu país.
Site Reliability Engineer

Site Reliability Engineer

EnterSão Paulo, Brasil
Há 3 dias
Descrição da vaga

Overview

A Enter (anteriormente Talisman AI) foi fundada em 2023 com a missão de tornar o Brasil um protagonista em Inteligência Artificial.

Unimos a expertise humana à eficiência da IA para ajudar grandes empresas da América Latina a otimizar processos críticos de alto volume e que exigem intenso trabalho manual.

Iniciamos nossa jornada aplicando IA para criar defesas jurídicas personalizadas em larga escala, permitindo que grandes empresas reduzam custos advocatícios e aumentem suas taxas de êxito.

Atendemos clientes como Nubank, Banco BMG, iFood, SulAmérica, Light, Banco Inter, Banco C6, entre outros.

Estamos buscando SRE (Site Reliability Engineer) experientes para desenvolver a fundação de nossa plataforma.

Este papel é fundamental para garantir a escalabilidade, observabilidade, resiliência e segurança de nossa operação.

O SRE na Enter desenvolve a plataforma de infraestrutura utilizada pelos engenheiros da empresa - aproveitando e refinando sistemas já existentes, além de construir novos serviços que aumentem a escalabilidade e a usabilidade.

É uma posição com uma atuação ampla na gestão da cloud (AWS), serviços de observabilidade, mensageria, armazenamento, controle de incidentes e segurança.

Não é necessário ter experiência prévia com todos esses assuntos, desde que você carregue uma curiosidade nata e uma capacidade de aprender conceitos difíceis rapidamente.

Na prática : Responsibilities

Contribuir diretamente para o desenvolvimento de funcionalidades e manutenção de serviços de infraestrutura para gestão, observabilidade, segurança, mensageria, escalabilidade, compliance e resposta a incidentes.

Manter e otimizar serviços de infraestrutura como Kubernetes, NATS, Postgres, Redis, Istio, Grafana, Prometheus, etc.

  • Definir padrões de monitoramento e observabilidade para serviços de infraestrutura;
  • Realizar troubleshooting e assistir na resolução de incidentes em produção;
  • Gerenciar e melhorar ferramentas e processos relacionados à gestão de infraestrutura em toda a empresa (padrões de Infrastructure-as-code, design de CI / CD, etc.);

Desenvolver os sistemas necessários para replicar nossa infraestrutura, gerando ambientes especializados sobre demanda.

O que valorizamos

Profissionais que não se contentam com respostas superficiais e mergulham nos detalhes.

Baixa necessidade de reconhecimento individual, priorizando o resultado acima do crédito pessoal.

Capacidade excepcional de enfrentar problemas abertos em ambientes não estruturados.

Disposição para aprender, orientar, liderar e seguir conforme necessário.

Senso de urgência desproporcional, mantendo em mente a escalabilidade e a criação de processos replicáveis para garantir o sucesso a longo prazo.

Pessoas genuinamente curiosas e que conseguem aprender coisas difíceis rapidamente.

Idealmente, você tem

Pelo menos 3 anos de experiência profissional como Backend Engineer, SRE, Cloud Engineer ou similar.

Usuário avançado de Linux e AWS.

Experiência desenvolvendo e / ou mantendo Kubernetes, NATS, Istio, Grafana, Prometheus, Terraform (Tofu).

Diferenciais

Graduação em Ciência da Computação, Engenharia ou áreas correlatas.

Familiaridade com Proficiência em Python.

#J-18808-Ljbffr

Criar um alerta de emprego para esta pesquisa

Site Reliability Engineer • São Paulo, Brasil