Mission :
O nosso time de Engenharia de Confiança de Sustentação procura por profissionais capacitados para projetar e operar arquiteturas escaláveis e seguras, garantindo resiliência e observabilidade contínua.
Objetivos :
- Desenvolver soluções inovadoras para aplicações distribuídas em infraestrutura como código (IaC) com Terraform, utilizando Kubernetes (GKE) ou Cloud Run.
- Criar pipelines CI / CD eficientes (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros.
- Implementar e otimizar serviços de banco de dados (Postgres), cache (Redis) e bases vetoriais, focando em desempenho e custo.
- Conduzir respostas a incidentes : alerta, mitigação, post-mortem, ações preventivas.
- Capacitar o time : disseminar boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.
Requisitos :
Experiência prática como SRE / DevOps em ambientes cloud (AWS, GCP ou Azure).Domínio de Linux, redes, containers (Docker) e Kubernetes.Proficiência em IaC (Terraform, Pulumi ou CloudFormation).Rotinas de CI / CD com GitHub Actions, GitLab CI, Argo CD ou similares.Instrumentação e alerta com Prometheus, Grafana, Loki / ELK, Alertmanager.Programação / scripting em Python e Bash (Go é bônus).Conhecimento de Postgres, Redis e tuning de performance.Experiência em gestão de incidentes e elaboração de post-mortems.Diferencial :
Conhecimento em infraestrutura em nuvem (Google Cloud Platform), conteinerização (Kubernetes) e serviços serverless.Experiência com Cloud Run, Knative ou FaaS.Noções de cost optimisation em FinOps.Contribuições open-source em projetos Cloud Native.Experiência com ferramentas de monitoramento e observabilidade, como Prometheus e Grafana.Familiaridade com pipelines de CI / CD.Conhecimento em infraestrutura como código (IaC), como Terraform.Experiência com agentes de IA, LLMs e RAG.Conhecimento em protocolos de rede, como TCP / IP e HTTP.Experiência com proxy reverso e balanceamento de carga.