Engenheiro(a) de Dados – LLMModelo de trabalho : RemotoBuscamos um(a) Engenheiro(a) de Dados / Cientista de Dados com forte experiência em LLMs e busca semântica / vetorial para construir soluções de ranqueamento inteligente de produtos a partir de texto livre, atuando junto a times de produto e engenharia para entregar pipelines e serviços escaláveis.Responsabilidades– Desenvolver e manter pipelines de tratamento e enriquecimento de dados para aplicações baseadas em LLM.
– Implementar e otimizar sistemas de busca vetorial e semântica com foco em ranqueamento de produtos.
– Trabalhar com embeddings e técnicas de similaridade textual para elevar a relevância dos resultados.
– Realizar fine-tuning / ajustes de modelos de linguagem e avaliar o melhor modelo por caso de uso.
– Integrar e configurar Azure AI Search (índices, mapas de sinônimos, indexação inteligente).
– Utilizar Azure OpenAI para soluções de IA generativa (incluindo RAG e chatbots especializados).
– Colaborar com cientistas de dados e engenheiros de ML garantindo qualidade e performance dos modelos.
– Monitorar, medir e melhorar continuamente os sistemas de busca e recomendação.Requisitos– Experiência prática com LLMs (ex. : GPT, BERT) e fine-tuning / embeddings customizados.
– Domínio de busca vetorial e semântica (ex. : FAISS, Milvus, Elasticsearch, Azure AI Search).
– Conhecimento em Azure AI Search e Azure OpenAI (configuração de índices, sinônimos e integração com modelos generativos).
– Proficiência em Python e bibliotecas de NLP (ex. : Hugging Face Transformers, spaCy).
– Familiaridade com arquiteturas distribuídas e boas práticas de engenharia de dados.Diferenciais– Experiência com ranqueamento de produtos ou sistemas de recomendação.
– Conhecimento em RAG (Retrieval-Augmented Generation).
Dados • São Paulo, Brasil