CIENTISTA DE DADOS - MODELAGEM ESPACIALVocê deve preencher o formulário disponível no link abaixo
pvs=105SOMENTE SERÃO AVALIADOS(AS) CANDIDATOS(AS) QUE ENVIAREM SUAS INFORMAÇÕES NESTE NO LINK INFORMADOCONTRATAÇÃO
O foco será a criação de algoritmos robustos para identificar, prever e priorizar áreas de alto risco nas estradas brasileiras, bem como atuar em ambiente multidisciplinar colaborando com engenheiros de dados, especialistas em GIS e biólogos.Principais AtividadesModelagem Preditiva Segmentada
Desenvolver modelos independentes (R1-R5) usando XGBoost, RandomForest, entre outros.
Criar modelo agregador integrando os outputs especializados.
Incorporar transfer learning e telemática (velocidade, frenagem, etc).
Feature Engineering & Dados Geoespaciais
Selecionar e transformar features críticas (curvatura, gradiente, faixas, clima, tipo veículo...).
Clean, integrar e tratar grandes bases heterogêneas (rodovias, clima, fauna, acidentes).
Operar agregação espacial com H3, imputação por vizinhança e filtros para outliers.
Validação Avançada & Transferência
Implementar validação Leave-One-Corridor Out (LOCO).
Justificar o uso de gates de extrapolação e calibração Platt scaling.
Calibrar thresholds por tipo de acidente visando sensibilidade / precisão.
Interpretabilidade & Comunicação
Gerar explicabilidade de modelos usando SHAP (top features, dependências).
Elaborar relatórios mensais e dashboards técnicos.
Recomendar intervenções específicas baseadas em outputs analíticos.
Integração com Engenharia de Dados & Deploy
Colaborar em API REST, exportação de modelos e integração com bancos PostGIS / H3.
Apoiar design de ETL e operacionalização (on-premise / nuvem).
Requisitos ObrigatóriosFormação superior (ciências exatas).
Necessário doutorado ou 6 anos de conclusão de graduação.
Forte experiência em machine learning aplicado (mínimo 2 anos prática, 3 anos Python).
Experiência comprovada com dados geoespaciais (Geopandas, Shapely, PostGIS).
Proficiência em pandas, scikit-learn, XGBoost, SHAP.
Sólida base de estatística, inferência, validação cruzada e métricas.
Experiência com bancos GIS; manuseio eficiente de dados espaciais.
Inglês técnico para compreensão de documentação e papers.Diferenciais (Desejáveis)Experiência com transfer learning, multi-task learning.
Domínio de deploy de modelos via API (FastAPI, Flask) e cloud (GCP, AWS).
Vivência com telemática (dados GPS, séries temporais, LSTM, CNN).
Familiaridade com MLOps, MLflow, detecção e monitoramento de drift.
Experiência quantitativa em análise de segurança viária ou ecologia de estradas.
Proatividade no uso de IA generativa (ChatGPT, Copilot).
Soft SkillsPensamento crítico, solução de problemas e autonomia analítica.
Capacidade de comunicação clara para equipes técnicas e não técnicas.
Facilidade para ambientes multidisciplinares (dados, GIS, fauna, engenharia).
Cientista Dados • Parnamirim, Rio Grande do Norte, Brasil