Talent.com
Cientista de dados

Cientista de dados

EnvironBITGuaramirim, Santa Catarina, Brazil
Há 3 dias
Descrição da vaga

CIENTISTA DE DADOS - MODELAGEM ESPACIAL

Você deve preencher o formulário disponível no link abaixo

https : / / striped-owner-101.notion.site / 1ee1d5630e8e807d8cabdaf14e485a7e?pvs=105

SOMENTE SERÃO AVALIADOS(AS) CANDIDATOS(AS) QUE ENVIAREM SUAS INFORMAÇÕES NESTE NO LINK INFORMADO

CONTRATAÇÃO

  • Tipo de Bolsa : Bolsa de Desenvolvimento Tecnológico DT-I — R$ 5.200,00 (Valores fixos conforme edital FAPEMIG; sem negociação.
  • Contratação como pessoa física, sem vínculo CLT, MEI ou PJ.)
  • Local de Trabalho 100 % home-office, obrigatoriamente residente em Minas Gerais
  • Formação : Graduação e experiência equivalente (≥6 anos) em ciência de dados, modelagem espacial de dados ambientais ou áreas correlatas ou Doutorado na área.

IMPORTANTE : Estes requisitos são exigência da FAPEMIG, não sendo possível alterar qualquer ponto.

Descrição Geral O Cientista de Dados será responsável pelo desenvolvimento de modelos preditivos segmentados de risco de acidentes rodoviários, utilizando dados geoespaciais, telemática veicular e infraestrutura viária. O foco será a criação de algoritmos robustos para identificar, prever e priorizar áreas de alto risco nas estradas brasileiras, bem como atuar em ambiente multidisciplinar colaborando com engenheiros de dados, especialistas em GIS e biólogos.

Principais Atividades Modelagem Preditiva Segmentada

Desenvolver modelos independentes (R1-R5) usando XGBoost, RandomForest, entre outros.

Criar modelo agregador integrando os outputs especializados.

Incorporar transfer learning e telemática (velocidade, frenagem, etc).

Feature Engineering & Dados Geoespaciais

Selecionar e transformar features críticas (curvatura, gradiente, faixas, clima, tipo veículo...).

Clean, integrar e tratar grandes bases heterogêneas (rodovias, clima, fauna, acidentes).

Operar agregação espacial com H3, imputação por vizinhança e filtros para outliers.

Validação Avançada & Transferência

Implementar validação Leave-One-Corridor Out (LOCO).

Justificar o uso de gates de extrapolação e calibração Platt scaling.

Calibrar thresholds por tipo de acidente visando sensibilidade / precisão.

Interpretabilidade & Comunicação

Gerar explicabilidade de modelos usando SHAP (top features, dependências).

Elaborar relatórios mensais e dashboards técnicos.

Recomendar intervenções específicas baseadas em outputs analíticos.

Integração com Engenharia de Dados & Deploy

Colaborar em API REST, exportação de modelos e integração com bancos PostGIS / H3.

Apoiar design de ETL e operacionalização (on-premise / nuvem).

Requisitos Obrigatórios Formação superior (ciências exatas). Necessário doutorado ou 6 anos de conclusão de graduação.

Forte experiência em machine learning aplicado (mínimo 2 anos prática, 3 anos Python).

Experiência comprovada com dados geoespaciais (Geopandas, Shapely, PostGIS).

Proficiência em pandas, scikit-learn, XGBoost, SHAP.

Sólida base de estatística, inferência, validação cruzada e métricas.

Experiência com bancos GIS; manuseio eficiente de dados espaciais.

Inglês técnico para compreensão de documentação e papers.

Diferenciais (Desejáveis) Experiência com transfer learning, multi-task learning.

Domínio de deploy de modelos via API (FastAPI, Flask) e cloud (GCP, AWS).

Vivência com telemática (dados GPS, séries temporais, LSTM, CNN).

Familiaridade com MLOps, MLflow, detecção e monitoramento de drift.

Experiência quantitativa em análise de segurança viária ou ecologia de estradas.

Proatividade no uso de IA generativa (ChatGPT, Copilot).

Soft Skills Pensamento crítico, solução de problemas e autonomia analítica.

Capacidade de comunicação clara para equipes técnicas e não técnicas.

Facilidade para ambientes multidisciplinares (dados, GIS, fauna, engenharia).

Criar um alerta de emprego para esta pesquisa

Cientista Dados • Guaramirim, Santa Catarina, Brazil