Quem Somos
A Dexian, lançada em 2023, é uma multinacional americana com quase 30 anos de experiência por meio das companhias legadas DISYS e Signature Consultants. Presente no Brasil desde 2007, somos referência em soluções de staffing, TI e complementação de força de trabalho, atuando em diversos setores com alcance global e agilidade tática.
Sobre a Vaga
Estamos em busca de um(a) Engenheiro(a) de Dados Sênior que será responsável por projetar, construir e manter pipelines de dados escaláveis em ambientes cloud, com foco em performance, governança e integração com múltiplas fontes de dados.
O que você precisa ter
- Experiência sólida em AWS (S3, Glue, Lambda, IAM, Athena, Redshift ou equivalente)
- Domínio de Databricks (Spark SQL, Delta Lake, clusters, jobs e notebooks)
- Proficiência em Python para engenharia de dados (pyspark, pandas, boto3)
- Forte conhecimento em SQL e modelagem de dados (dimensional, relacional e data lakehouse)
- Experiência com pipelines ETL / ELT , versionamento com Git e práticas de CI / CD
- Capacidade de analisar e otimizar performance de queries e jobs de processamento distribuído
Desejáveis
Vivência com arquitetura Lakehouse e Unity CatalogConhecimento em ferramentas de orquestração ( Airflow, Databricks Workflows, Step Functions )Experiência com integrações via APIs REST e dados em tempo real ( Kafka, Kinesis )Familiaridade com boas práticas de FinOps e otimização de custos em ambientes cloudInglês desejávelResponsabilidades
Projetar, desenvolver e manter pipelines de dados utilizando Databricks (Spark, Delta Lake, notebooks e jobs)Integrar e transformar dados de múltiplas fontes (bancos relacionais, APIs, S3, etc.)Implementar boas práticas de versionamento, logging, monitoramento e documentaçãoTrabalhar em parceria com os times de Analytics, Data Science e Produto para garantir a qualidade e disponibilidade dos dadosCriar e otimizar consultas SQL e scripts em Python para grandes volumes de dadosAssegurar segurança e governança de dados , alinhado às políticas internas e à arquitetura AWS (IAM, Glue, Lake Formation, etc.)Realizar tuning de performance em jobs Spark e consultas SQLLocal de Atuação : Híbrido (2x por semana presencial) – Avenida Magalhães de Castro, Cidade Jardim – SP