Pedro Pereira

Cientista de Dados_

Transformando dados complexos em soluções inteligentes. Mestre em ciência de dados, professor universitário, palestrante e especialista no desenvolvimento de produtos de inteligência artificial prontos para produção.

Pedro Pereira - Foto Profissional

Sobre Mim

Cientista de Dados e líder técnico do time de AI Engineering na CGDados/ENAP com sólida experiência em análises descritivas, diagnósticas e preditivas, atuando desde a engenharia e arquitetura de dados até a geração de insights estratégicos e deploy de soluções de dados em nuvem.

Tenho como característica principal a habilidade de extrair valor de dados textuais por meio de Processamento de Linguagem Natural (NLP) e Inteligência Artificial aplicada. Além da vasta expertise no desenvolvimento de análises e visualizações de dados complexas, possuo experiência na concepção de sistemas de recomendação, busca semântica/lexical e RAGs e automações baseadas em SLMs e fluxos de agentes de IA baseados em grafos.

Como lead de AI Engineering, venho conduzindo o desenvolvimento de soluções de IA aplicadas a problemas reais do setor público. Entre os principais projetos, destaque para a concepção do InfoChat Open, um agente de text-to-SQL baseado em SLMs open source que permite a gestores consultarem dados do negócio em linguagem natural, eliminando a dependência de conhecimento em SQL e acelerando a tomada de decisão baseada em dados. Também desenvolvi um sistema de recomendação em larga escala baseado em busca semântica com embeddings densos (SBERT), capaz de gerar recomendações personalizadas de capacitações para dezenas de milhares de servidores simultaneamente, reduzindo um processo manual que mobilizava uma equipe inteira por cerca de duas semanas para poucos minutos e gerando economia operacional relevante para a organização. Atualmente, atuo no desenvolvimento de um RAG agentico pronto para produção, com técnicas de chunking semântico, busca híbrida com RRF, guardrails e observabilidade, estruturado inteiramente em Python e LangGraph.

Core

PythonAWSGCPSQLPower BI

Machine Learning / AI

NLPTransformersScikit-LearnStreamlitPydanticAILangGraphHuggingFace PyTorchLangsmithLlamaIndex

Tools & Cloud

AWS (S3/EC2)DockerGitGitHub/ ActionsPower BIGoogle BigQueryExcelGoogle LookerGoogle Sheets GCP(GKE/GCS/Cloud Run)PrometheusPostgresBash

Educação

  • Mestrado em Ciência de Dados Para Empresas Inst. Politécnico de Setúbal (2023-2025)
  • Pós-Graduação em Ciência de Dados/Big Data Universidade Cruzeiro do Sul (2022-2023)
  • Curso Superior de Tecnologia em Gestão Pública Centro Universitário de Maringá (2014-2017)

Experiência Profissional

Jan 2026 - Atual

Professor Assistente

Centro Universitário de Brasília (UniCEUB)

  • Professor das disciplinas de Introdução à Ciência de Dados e Business Intelligence II para alunos da graduação em ciência de dados e machine learning.
Jan 2022 - Atual

Cientista de Dados

Escola Nacional de Administração Pública (ENAP)

  • Atuação como líder técnico em projetos de Inteligência Artificial e Ciência de Dados, com foco em soluções para o setor público.
  • Desenvolvimento de sistema de matching de necessidades de capacitação Vs.cursos ofertados com uso de Inteligência Artificial (NLP e Arquitetura de Transformers SBERT), gerando expressiva economia financeira.
  • Automação de rotinas com Python, GitHub Actions e GitLab CI/CD, além de desenvolvimento de Web Scrapers (Selenium, Scrapy).
  • Modelagem de dados e criação de dashboards gerenciais em Looker e Power BI.
  • Desenvolvimento de análises em bases de dados governamentais complexas para subsidiar a tomada de decisão em termos de políticas públicas federais.
  • Criação/Deploy (Python, AWS EC2, S3 e RDS) de soluções baseadas em NLP.
  • Criação/Deploy (Python, GCP GKE, GCS e BigQuery) de aplicação de text-2-sql com SLMs open source e LangGraph para tradução de questões em linguagem natural para queries SQL de maneira automatizada em bancos de dados Postgres e BigQuery.
  • Atuação como professor de SQL e Inteligência Artificial para alunos do Mestrado Profissional em Avaliação e Monitoramento de Políticas Públicas da ENAP.
Out 2013 - Set 2022

Técnico Administrativo

DNIT

  • Desenvolvimento de planilhas de controle orçamentário e de ativos de patrimônio ferroviário.
  • Elaboração de documentos técnicos e relatórios administrativos.
  • Uso de python para automação de rotinas administrativas.
  • Desenvolvimento de dashboards em Power BI para acompanhamento de indicadores administrativos.
  • Liderança de equipes e atendimento focado na área de gestão pública.

Projetos em Destaque

Algumas soluções e repositórios desenvolvidos recentemente.

Sistema de Recomendação de Cursos NLP based

Motor NLP que utiliza arquitetura de transformers (SBERT) e TFIDF para realizar match entre perfis de capacitação e portfólio de cursos.

PythonNLPTransformers

RAG Agentico

RAG agentico avançado, com arquitetura baseada em grafos (langgraph) e Small Language Models (SLM) open source.

PythonLangGraphSLM

Webapp para monitoramento de estudos

Webapp para monitoramento de estudos para concursos públicos e ENEM, com dashboard interativo e relatórios personalizados.

PythonStreamlitSQLite

Vamos Conversar?

Estou disponível para consultorias em Dados e IA, projetos como freelancer e para palestras e capacitações sobre IA, Python, SQL, Power BI e demais assuntos relacionados a data science.

Falar com o Pedro
phmellop@hotmail.com
Brasília, DF - Brasil 🇧🇷 | Guimarães, Portugal 🇵🇹