Requisitos : Experiência sólida com engenharia de software aplicada a dados e machine learning. Proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares. Experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS. Conhecimento em MLOps e CI / CD para pipelines de dados e modelos. Experiência com orquestração de workflows. Capacidade de escrever código limpo, modular e testável.
Diferenciais : Experiência com infraestrutura como código (Terraform, CloudFormation). Participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade.
Responsabilidades principais : Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS). Integrar dados e métricas de avaliação em um fluxo automatizado e auditável. Modularizar o pipeline para facilitar reuso, testes e manutenção. Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto. Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados. Propor melhorias contínuas na arquitetura de dados e nos processos de validação.
Engenheiro Learning • São Carlos, Brasil