CIENTISTA DE DADOS - MODELAGEM ESPACIAL
Você deve preencher o formulário disponível no link abaixo
SOMENTE SERÃO AVALIADOS(AS) CANDIDATOS(AS) QUE ENVIAREM SUAS INFORMAÇÕES NESTE NO LINK INFORMADO
CONTRATAÇÃO
- Tipo de Bolsa : Bolsa de Desenvolvimento Tecnológico DT-I — R$ 5.200,00 (Valores fixos conforme edital FAPEMIG; sem negociação.
- Contratação como pessoa física, sem vínculo CLT, MEI ou PJ.)
- Local de Trabalho 100 % home-office, obrigatoriamente residente em Minas Gerais
- Formação : Graduação e experiência equivalente (≥6 anos) em ciência de dados, modelagem espacial de dados ambientais ou áreas correlatas ou Doutorado na área.
IMPORTANTE : Estes requisitos são exigência da FAPEMIG, não sendo possível alterar qualquer ponto.
Descrição Geral
O Cientista de Dados será responsável pelo desenvolvimento de modelos preditivos segmentados de risco de acidentes rodoviários, utilizando dados geoespaciais, telemática veicular e infraestrutura viária. O foco será a criação de algoritmos robustos para identificar, prever e priorizar áreas de alto risco nas estradas brasileiras, bem como atuar em ambiente multidisciplinar colaborando com engenheiros de dados, especialistas em GIS e biólogos.
Principais Atividades
Modelagem Preditiva Segmentada
Desenvolver modelos independentes (R1-R5) usando XGBoost, RandomForest, entre outros.Criar modelo agregador integrando os outputs especializados.Incorporar transfer learning e telemática (velocidade, frenagem, etc).Feature Engineering & Dados Geoespaciais
Selecionar e transformar features críticas (curvatura, gradiente, faixas, clima, tipo veículo...).Clean, integrar e tratar grandes bases heterogêneas (rodovias, clima, fauna, acidentes).Operar agregação espacial com H3, imputação por vizinhança e filtros para outliers.Validação Avançada & Transferência
Implementar validação Leave-One-Corridor Out (LOCO).Justificar o uso de gates de extrapolação e calibração Platt scaling.Calibrar thresholds por tipo de acidente visando sensibilidade / precisão.Interpretabilidade & Comunicação
Gerar explicabilidade de modelos usando SHAP (top features, dependências).Elaborar relatórios mensais e dashboards técnicos.Recomendar intervenções específicas baseadas em outputs analíticos.Integração com Engenharia de Dados & Deploy
Colaborar em API REST, exportação de modelos e integração com bancos PostGIS / H3.Apoiar design de ETL e operacionalização (on-premise / nuvem).Requisitos Obrigatórios
Formação superior (ciências exatas). Necessário doutorado ou 6 anos de conclusão de graduação.Forte experiência em machine learning aplicado (mínimo 2 anos prática, 3 anos Python).Experiência comprovada com dados geoespaciais (Geopandas, Shapely, PostGIS).Proficiência em pandas, scikit-learn, XGBoost, SHAP.Sólida base de estatística, inferência, validação cruzada e métricas.Experiência com bancos GIS; manuseio eficiente de dados espaciais.Inglês técnico para compreensão de documentação e papers.Diferenciais (Desejáveis)
Experiência com transfer learning, multi-task learning.Domínio de deploy de modelos via API (FastAPI, Flask) e cloud (GCP, AWS).Vivência com telemática (dados GPS, séries temporais, LSTM, CNN).Familiaridade com MLOps, MLflow, detecção e monitoramento de drift.Experiência quantitativa em análise de segurança viária ou ecologia de estradas.Proatividade no uso de IA generativa (ChatGPT, Copilot).Soft Skills
Pensamento crítico, solução de problemas e autonomia analítica.Capacidade de comunicação clara para equipes técnicas e não técnicas.Facilidade para ambientes multidisciplinares (dados, GIS, fauna, engenharia).