Missionário de SoluçõesAtua na garantia da disponibilidade contínua e confiabilidade dos sistemas, aplicando princípios de engenharia de software para resolver desafios operacionais.
Desenvolve uma cultura orientada a dados, automação e confiabilidade.Responsabilidades e AtribuiçõesDefine e acompanha SLIs / SLOs e indicadores de confiabilidade por produto e ambiente;Atinge no design e melhoria contínua de pipelines de observabilidade (tracing, métricas e logs);Lidera o processo de incident response, conduzindo post-mortems e promovendo ações corretivas;Colabora com times de desenvolvimento para garantir resiliência desde o design da aplicação;Automatiza tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;Participa da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery;Apoia cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;Utiliza ferramentas de análise de performance (APM) para diagnóstico e mitigação de gargalos.DiferenciaisCertificações relevantes (ex : Google SRE, AWS DevOps Engineer, Kubernetes CKA / CKS);Experiência em ambientes com cultura de SRE madura (SLIs / SLOs, Toil reduction, etc);Vivência com testes de caos e engenharia de resiliência (Chaos Monkey, Gremlin);Capacidade de análise de custos operacionais e otimização de uso da infraestrutura;Experiência com automação de testes de performance e de carga;Atuação anterior com feature flags, dark launches e blue / green deployments.RequisitosPossuir conhecimentos avançados em programação e desenvolvimento de software;Ter experiência em gerenciamento de serviços e infraestrutura em nuvem;Conhecer princípios de segurança e privacidade dos dados;Dispor de habilidades em liderança e colaboração.
Arquiteto • Indaiatuba, São Paulo, Brasil