Principais responsabilidades: Projetar, desenvolver e otimizar modelos preditivos e prescritivos, aplicando técnicas de Machine Learning e estatística avançada (regressão, árvores de decisão, séries temporais, clustering, boosting, etc.); Implementar e manter pipelines de dados escaláveis, utilizando ferramentas de processamento distribuído (Spark, Dask, Polars, entre outras); Criar, versionar e disponibilizar APIs de modelos e serviços de ML utilizando Flask ou FastAPI; Elaborar e conduzir experimentos e testes A/B para comparação e validação de modelos; Garantir boas práticas em SQL e modelagem de dados, otimizando consultas e estruturas de armazenamento; Realizar análises exploratórias e manipulação de dados em larga escala para geração de insights e apoio à tomada de decisão; Aplicar técnicas de NLP (Processamento de Linguagem Natural) para pré-processamento, embeddings, classificação, sumarização e extração de informações; Utilizar ferramentas de versionamento (Git, GitHub, GitLab) para controle de código e colaboração entre equipes; Integrar soluções de Inteligência Artificial generativa, com uso de OpenAI e ferramentas correlatas. Requisitos técnicos: Domínio de Ferramentas e Frameworks para LLMs, NLP e GenAI: LLaMA, Mistral, Hugging Face Transformers, LangChain, OpenAI API, Google Vertex AI, RAG e técnicas de fine-tuning para soluções de automação, análise e geração de conteúdo; Experiência testes unitários e CI/CD: para pipelines de dados e modelos; Experiência em MLOps: práticas de integração, deploy e monitoramento de modelos; Experiência com sistema de recomendação; Sistemas de Mensageria: experiência com Kafka ou RabbitMQ; Ensino superior em cursos como Estatística, Matemática, Engenharias, Física ou cursos correlatos.
Advisor, Data Science and Analytics
Transunion
Analyst, Data Science and Analytics
Transunion
Data Science Lead
Madiffpl
Data Science
Gamalearnss
Manager of Data Science and Business Intelligence
Pivotal Solutions
Data Science Developer
PaxeraHealth