About this role

Principais responsabilidades: Projetar, desenvolver e otimizar modelos preditivos e prescritivos, aplicando técnicas de Machine Learning e estatística avançada (regressão, árvores de decisão, séries temporais, clustering, boosting, etc.); Implementar e manter pipelines de dados escaláveis, utilizando ferramentas de processamento distribuído (Spark, Dask, Polars, entre outras); Criar, versionar e disponibilizar APIs de modelos e serviços de ML utilizando Flask ou FastAPI; Elaborar e conduzir experimentos e testes A/B para comparação e validação de modelos; Garantir boas práticas em SQL e modelagem de dados, otimizando consultas e estruturas de armazenamento; Realizar análises exploratórias e manipulação de dados em larga escala para geração de insights e apoio à tomada de decisão; Aplicar técnicas de NLP (Processamento de Linguagem Natural) para pré-processamento, embeddings, classificação, sumarização e extração de informações; Utilizar ferramentas de versionamento (Git, GitHub, GitLab) para controle de código e colaboração entre equipes; Integrar soluções de Inteligência Artificial generativa, com uso de OpenAI e ferramentas correlatas. Requisitos técnicos: Domínio de Ferramentas e Frameworks para LLMs, NLP e GenAI: LLaMA, Mistral, Hugging Face Transformers, LangChain, OpenAI API, Google Vertex AI, RAG e técnicas de fine-tuning para soluções de automação, análise e geração de conteúdo; Experiência testes unitários e CI/CD: para pipelines de dados e modelos; Experiência em MLOps: práticas de integração, deploy e monitoramento de modelos; Experiência com sistema de recomendação; Sistemas de Mensageria: experiência com Kafka ou RabbitMQ; Ensino superior em cursos como Estatística, Matemática, Engenharias, Física ou cursos correlatos.

Especialista Data Science

About this role

Similar jobs

Similar jobs

Similar jobs