Formação em Tecnologia, Matemática, Estatística, Economia ou áreas correlatas.Forte conhecimento em SQL;Boa lógica de programação e raciocínio analítico;Experiência com Spark ou Databricks em ambientes distribuídos;Domínio de ambientes Azure (Data Factory, Data Lake, Synapse, Event Hub, Functions, etc.);Noções práticas de DevOps;Capacidade de compreender rapidamente processos de negócio e propor soluções de dados aderentes;Proficiência em bancos de dados relacionais e não relacionais.
;Habilidades de programação em Python e / ou Scala;Boa comunicação e relacionamento com times técnicos e de negócio.Atuar na extração, transformação e carga de dados em ambientes distribuídos;Coletar, limpar e transformar dados brutos em formatos utilizáveis para análise;Desenvolver e manter pipelines de dados eficientes e escaláveis;Gerenciar, modelar e utilizar bancos de dados relacionais (SQL), não relacionais (NoSQL) e datawarehouses;Colaborar com cientistas de dados e outros profissionais de análise para fornecer insights acionáveis;Participar de reuniões de definição e planejamento;Acompanhar e aplicar as boas práticas e padronizações;Monitorar e otimizar o desempenho dos sistemas de dados.Diferenciais : Certificações Azure (por exemplo, Microsoft Certified : Azure Data Engineer Associate);Certificação Databricks de nível médio ou avançado (Data Engineer Associate ou Professional);Bom conhecimento das ferramentas que compõem o Spark;Bom conhecimento com bancos de dados NoSQL, como Cassandra, Cosmos, etc;Proficiência em plataformas de streaming de eventos, como Eventhubs, Kafka ou MSK;Histórico de liderança técnica em projetos.
Pessoa Engenheira • São Paulo, Brasil