Quem Somos A Dexian, lançada em 2023, é uma multinacional americana com quase 30 anos de experiência por meio das companhias legadas DISYS e Signature Consultants. Presente no Brasil desde 2007, somos referência em soluções de staffing, TI e complementação de força de trabalho, atuando em diversos setores com alcance global e agilidade tática.
Sobre a Vaga Estamos em busca de um(a)
Engenheiro(a) de Dados Sênior
que será responsável por projetar, construir e manter pipelines de dados escaláveis em ambientes cloud, com foco em performance, governança e integração com múltiplas fontes de dados.
O que você precisa ter Experiência sólida em
AWS
(S3, Glue, Lambda, IAM, Athena, Redshift ou equivalente) Domínio de
Databricks
(Spark SQL, Delta Lake, clusters, jobs e notebooks) Proficiência em
Python
para engenharia de dados (pyspark, pandas, boto3) Forte conhecimento em
SQL
e modelagem de dados (dimensional, relacional e data lakehouse) Experiência com
pipelines ETL / ELT , versionamento com
Git
e práticas de
CI / CD Capacidade de analisar e otimizar performance de queries e jobs de processamento distribuído
Desejáveis Vivência com arquitetura
Lakehouse
Unity Catalog Conhecimento em ferramentas de orquestração ( Airflow, Databricks Workflows, Step Functions ) Experiência com
integrações via APIs REST
e dados em tempo real ( Kafka, Kinesis ) Familiaridade com boas práticas de
FinOps
e otimização de custos em ambientes cloud Inglês desejável
Responsabilidades Projetar, desenvolver e manter
pipelines de dados
utilizando Databricks (Spark, Delta Lake, notebooks e jobs) Integrar e transformar dados de
múltiplas fontes
(bancos relacionais, APIs, S3, etc.) Implementar boas práticas de
versionamento, logging, monitoramento e documentação Trabalhar em parceria com os times de
Analytics, Data Science e Produto
para garantir a qualidade e disponibilidade dos dados Criar e otimizar
consultas SQL
e scripts em
Python
para grandes volumes de dados Assegurar
segurança e governança de dados , alinhado às políticas internas e à arquitetura AWS (IAM, Glue, Lake Formation, etc.) Realizar
tuning de performance
em jobs Spark e consultas SQL
Local de Atuação :
Híbrido (2x por semana presencial) – Avenida Magalhães de Castro, Cidade Jardim – SP
Engenheiro Dados • São Paulo, Brasil