OverviewJoin to apply for the Engenheiro(a) de IA & Dados role at ManipulaêSomos a Unidade de Negócios de Manipulação da RD Saúde e, por meio das marcas Raia Manipulação e Drogasil Manipulação, atenderemos todos nossos clientes, com a missão de ser a farmácia de manipulação que todo brasileiro confia, escolhe e ama.
Como uma das soluções de saúde da maior empresa brasileira do setor varejista farmacêutico, fazemos parte das mais de 50 mil pessoas unidas pelo mesmo propósito de cuidar de perto da saúde e bem-estar das pessoas em todos os momentos da vida.
Temos como vocação cuidar dos nossos clientes e das nossas pessoas e nossos principais valores são : Cuidamos de gente, executamos com foco e construímos o futuro.
Responsabilidades
- Projetar / entregar soluções de IA Generativa & Preditiva (RAG, embeddings, OCR, detecção de objetos, NLP), com MLOps / DataOps em produção;
- Orquestrar pipelines ETL / ELT no Microsoft Fabric e disponibilizar dados confiáveis para Power BI e apps de IA;
- Monitorar jobs / datasets / modelos (SLI / SLO / SLA), observabilidade e alertas; testes automatizados (SQL / DAX / transformações / validações);
- Integrar e Deploy : Conectar pipelines de machine learning a sistemas de produção;
- Otimizar Códigos : Habilidade para criar scripts eficientes, usando práticas de profiling e paralelização;
Requisitos e qualificações
IA Generativa : RAG, embeddings, structured output, tool usage / agents, prompt design, fine-tuning (quando aplicável) e controle de custos / latência;NLP / CV : OCR, detecção de objetos, classificação / extração; pipelines de pré-processamento e avaliação;ML Clássico / Deep : seleção de modelos, validação, métricas, explicabilidade básica; pipelines de treinamento / inferência;Bases Vetoriais e busca semântica (ex. : Azure AI Search, Redis / FAISS / pgvector);Microsoft Fabric : OneLake, Lakehouse, Data Warehouse, Pipelines (Data Factory), Dataflows Gen2, Notebooks (Spark / PySpark) e integração com Power BI (Direct Lake / Import / DirectQuery / Composite);Camadas Bronze / Prata / Ouro, Delta / Parquet, particionamento, agendamento, orquestração e linhagem;Proficiência em Python : Experiência sólida em programação, inclusive com bibliotecas científicas (NumPy, Pandas, Scikit-learn, PyTorch, TensorFlow etc.);SQL : construção e otimização de consultas avançadas;Vector Base (Bases Vetoriais) : armazenar embeddings e realizar busca semântica de alta performance;Conectores (SQL Server, APIs / REST, arquivos, SFTP; desejável Firebird), cargas incrementais, CDC / Change Tracking, schema drift e reprocessamento idempotente;Modelagem dimensional (Star / Snowflake), SCD 1 / 2 e boas práticas OLTP / OLAP;DAX avançado, Incremental Refresh, Aggregations, RLS / OLS, semântica corporativa, governança de workspaces e Deployment Pipelines.
Data storytelling e padrões visuais corporativos;Power Query (M), Power Pivot (DAX), Tabelas Dinâmicas, Modelo de Dados, XLOOKUP / XMATCH / LET / LAMBDA, validações e formatação condicional;Versionamento (Git), CI / CD de dados e modelos (Fabric + Azure DevOps / GitHub), registro de modelos, feature store (quando houver);Qualidade de dados (ex. : expectativas / regras de negócio), catálogo / linhagem e LGPD (PII, RLS / OLS), chaves / segredos (Key Vault).
Ter finalizado projetos ponto a ponto de dados + IA em produção, com participação na definição de escopo, arquitetura, custos e operação contínua;Apresentação direta a áreas de negócio, com entregas sem supervisão constante e alto índice de confiabilidade;Otimização de capacidade / custos no Fabric e de tokens / inferências em soluções de IA;Diferencial experiência como desenvolvedor Backend.
Confiabilidade de pipelines (SLA / SLO), tempo de refresh e custo por atualização;Acurácia / qualidade de dados (regras atendidas, taxa de incidentes) e performance de relatórios (Power BI)
Eficiência de IA (latência, custo por requisição, taxa de sucesso / extração, métricas de modelo);Adoção pelo negócio (uso de dashboards / datasets, NPS interno) e redução de esforço manual.
Informações adicionais
Nossos benefícios : Assistência médica
Assistência Odontológica - Sulamérica
Cartão Flash ( Beneficio Flexível de alimentação e refeição)
Desconto em fórmulas manipuladas
Cartão Univers (Desconto em farmácias Raia e Drogasil)
Seguro de Vida - Prudential
Day off (Dia de Descanso no mês de aniversario)
Wellhub (Aplicativo voltado para saúde)
Bônus Semestral
Telemedicina Fleury
Get notified about new Data Engineer jobs in São Paulo, São Paulo, Brazil.
#J-18808-Ljbffr