Sobre a Vaga
Como Especialista DevOps Sênior Cloud & IA, você será a peça-chave na evolução da infraestrutura que suporta nossa plataforma de IA . Sua missão abrangerá três pilares centrais : a migração estratégica de nossos serviços da Azure para a AWS; a otimização de performance e custos (FinOps) em ambientes Kubernetes; e a implementação de infraestrutura para processamento de IA open-source na AWS. Esta é uma função crítica que exige profundo conhecimento técnico em operações de nuvem, segurança (DevSecOps) e um interesse genuíno no emergente campo de AIOps.
Responsabilidades
- Planejar, executar e validar a migração completa da infraestrutura de cloud, movendo as cargas de trabalho da Azure para a AWS, garantindo mínima disrupção e máxima eficiência.
- Assumir a arquitetura e customização do ambiente Kubernetes (K8s), assegurando a escalabilidade e resiliência da plataforma "Pullse".
- Implementar e otimizar técnicas avançadas de auto-scaling, utilizando HPA (Horizontal Pod Autoscaler) e KEDA (Kubernetes Event-driven Autoscaling) para responder dinamicamente às cargas de trabalho de IA.
- Estruturar e operar a infraestrutura para processamento de modelos de IA open-source, utilizando AWS Bedrock como serviço gerenciado principal.
- Aplicar rigorosas práticas de DevSecOps, com foco na gestão e rotação de secrets (segredos) em ambientes de contêineres.
- Gerenciar e manter o AWS Cognito para autenticação e autorização de usuários na plataforma.
- Implementar estratégias de FinOps, focando na otimização agressiva de custos através do uso e gerenciamento de instâncias Spot (EC2 Spot).
Requisitos Obrigatórios
Experiência comprovada como Engenheiro(a) DevOps ou SRE (Site Reliability Engineering) em ambientes de alta disponibilidade.Profundo conhecimento do ecossistema AWS (VPC, EC2, S3, IAM, EKS) e experiência prática com AWS Cognito.Experiência s ólida em migração de infraestrutura entre provedores de nuvem (especificamente Azure para AWS).Domínio de ferramentas de Infraestrutura como Código (IaC) , especificamente Terraform ou AWS CloudFormation.Domínio de Kubernetes (K8s), incluindo arquitetura, deployments, networking e segurança de clusters.Experiência prática com gerenciamento de aplicações em K8s utilizando Helm e Kustomize.Experiência prática na implementação de soluções de auto-scaling (HPA e / ou KEDA).Conhecimento sólido em ferramentas de observabilidade (ex : Prometheus, Grafana, ELK Stack) aplicadas a ambientes distribuídos.Conhecimento em práticas de DevSecOps, notadamente na gestão de secrets (ex : AWS Secrets Manager, HashiCorp Vault).Experiência em AWS Bedrock ou serviços equivalentes para operações de modelos de IA.Diferenciais
Experiência avançada em FinOps, com histórico comprovado de otimização de custos em nuvem (especialmente com instâncias Spot).Certificações relevantes (ex : AWS Certified DevOps Engineer, AWS Certified Security - Specialty, Certified Kubernetes Administrator - CKA).Experiência anterior com ferramentas de orquestração de IA ou plataformas de MLOps.