Atividades :
Colaboração com Líderes e Times :
- Trabalhar em estreita colaboração com os líderes de equipe para entregar soluções seguras, confiáveis, robustas e escaláveis.
- Promover a colaboração entre as equipes de Engenharia de Plataformas e de Tecnologia, garantindo alinhamento nas melhores práticas e objetivos.
Implementação de Boas Práticas de SRE :
Identificar e aplicar as melhores práticas de SRE (Site Reliability Engineering) para aprimorar a confiabilidade e o desempenho dos sistemas.Promover uma cultura de melhoria contínua e aprendizado dentro da equipe.Entrega Contínua e Automação :
Garantir o uso de pipelines e ferramentas de entrega contínua para automatizar totalmente o processo de implantação, testes, entrega e gerenciamento de sistemas de desenvolvimento, QA e produção em diversas plataformas de nuvem.Desenvolver e manter scripts de automação para otimizar operações e reduzir intervenções manuais.Monitoramento e Gerenciamento de Incidentes :
Implementar soluções de monitoramento abrangentes para detectar e responder proativamente a problemas do sistema.Assumir a responsabilidade pelo gerenciamento de incidentes, incluindo investigação, análise da causa raiz e implementação de medidas preventivas.Desenvolver e manter planos de resposta a incidentes, garantindo que a equipe esteja preparada para situações de emergência.Otimização e Ajuste de Desempenho :
Monitorar continuamente o desempenho dos sistemas e implementar otimizações para aumentar a eficiência e a confiabilidade.Realizar periodicamente ajustes de performance e planejamento de capacidade para garantir que os sistemas possam lidar com o crescimento e a demanda.Inovação e Liderança Técnica :
Manter-se atualizado sobre as mais recentes ferramentas, tecnologias e abordagens na área de SRE.Inspirar e liderar a equipe a pensar de forma inovadora, desenvolvendo soluções que mantenham a Dentsu à frente do mercado.Contribuir para a comunidade de SRE, compartilhando conhecimento e melhores práticas.Requisitos da vaga :
Inglês fluente.Administração de Sistemas UNIX / Linux : Forte experiência em administração de sistemas UNIX / Linux.Orquestração de Contêineres : Conhecimento avançado em tecnologias de orquestração de contêineres, com ênfase em Kubernetes.Integração Contínua e Testes Automatizados : Proficiência em práticas de integração contínua e testes automatizados.Plataformas de CI : Experiência com uma ou mais plataformas populares de CI (ex. : Jenkins, Bamboo, Travis, Brigade).Gerenciador de Pacotes Helm : Proficiência no uso do Helm para gerenciamento de aplicações em Kubernetes.Plataformas de Nuvem : Experiência sólida com pelo menos uma grande plataforma de nuvem (ex. : AWS, Azure, Google Cloud).Gerenciamento de Configuração : Conhecimento em ferramentas de gerenciamento de configuração como Ansible e Terraform.Redes : Fortes habilidades em redes TCP / IP.Infraestrutura de Chaves Públicas (PKI) : Boa compreensão de PKI e suas aplicações.Habilidades em Scripting : Domínio de scripts em bash, sh ou ksh.Linguagens de Programação : Experiência em pelo menos uma linguagem adicional (ex. : Go, JavaScript, Python, Perl).Gerenciamento do Ciclo de Vida de Versões : Experiência na gestão do ciclo de vida de versões de plataformas e serviços compartilhados, incluindo planejamento, implantação, manutenção e desativação.Liderança Inovadora : Capacidade de desafiar e propor novas ideias e abordagens.Defensor da Automação : Paixão por testes automatizados e implantação contínua.Adaptabilidade : Capacidade de aprender e se adaptar rapidamente a novas técnicas, frameworks e plataformas.Perfil Versátil : Habilidade para alternar facilmente entre estratégia, liderança, gestão e atividades técnicas práticas.Comunicação e Colaboração : Excelentes habilidades de comunicação, gestão de stakeholders e trabalho em equipe.