Principais Responsabilidades
- Desenvolver modelos e ferramentas que permitam o monitoramento da performance dos ativos da Rio Energy;
- Desenvolver e operacionalizar relatórios automáticos com os principais KPIs monitorados pela área de O&M;
- Interface Técnica : Atuar como ponte entre ciência e engenharia de dados, traduzindo requisitos de modelos ML em especificações técnicas de infraestrutura e pipelines;
- Projetar e implementar arquiteturas de dados end-to-end, desde ingestão até modelagem, incluindo data warehouses e data lakes;
- Colaborar no desenvolvimento de pipelines de dados robustas utilizando Airflow, Kedro;
- Participar da implementação de sistemas de controle de versão utilizando Liquibase;
- Apoiar no desenvolvimento de pipelines de CI / CD para modelos de ML;
- Contribuir com sistemas de monitoramento de performance e qualidade de dados;
- Auxiliar no gerenciamento de infraestrutura de ML utilizando ferramentas cloud-native;
- Manter documentação técnica e participar de sessões de conhecimento.
Formação e Experiência
Graduação em Ciência da Computação, Engenharia de Computação, Engenharias, Matemática, Física ou áreas correlatas.Inglês Avançado (leitura de documentação técnica e comunicação).Domínio de Linguagens de Programação : Python (intermediário a avançado), SQL (intermediário a avançado).Conhecimento em Data Warehouse, Data Lake, Bancos de Dados (Microsoft SQL Server, PostgreSQL).Conhecimento em Pipeline de Dados (Airflow, Kedro).MLOps e Orquestração : Docker, Gitlab CI / CD, ou similares.Versionamento : Git, controle de versão de esquemas de banco.Vivência prévia como Machine Learning Engineer, Data Engineer ou Software Engineer é desejável.Experiência em Deployment de modelos de ML em ambiente produtivo com suporte de profissionais sêniores.Experiência em trabalho colaborativo com times multidisciplinares.Especialização ou Mestrado é um diferencial.Desejável experiência no setor de energias renováveis ou IoT industrial.Competências Técnicas Desejáveis
Controle de Versão de Schema : Liquibase.Large Language Models : OpenAI API, Hugging Face, LangChain, prompt engineering.Experiência com SCADA e dados de séries temporais industriais.Frameworks de ML : Scikit-learn, TensorFlow / PyTorch, XGBoost.Testes : Pytest, testes unitários e de integração.Cloud Platforms : AWS / GCP / Azure com foco em serviços de dados.Diferenciais
Interesse em implementação de soluções baseadas em LLMs.Experimentação de modelos.Conhecimento básico em segurança e Compliance para sistemas de dados e ML.Experiência prévia atuando como interface entre times técnicos.Informações adicionais
Local de Atuação : Rio de Janeiro - Bairro Jardim Botânico - BrasilFormato Híbrido