Skip to content
View smalldatalabbr's full-sized avatar

Block or report smalldatalabbr

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
smalldatalabbr/README.md

Hey, I'm Jhonathan Domingues 👋

Sou Cientista de Dados em migração estruturada a partir da engenharia, com mais de 15 anos de experiência em ambientes industriais complexos, atuando com análise técnica, modelagem, diagnóstico de falhas e suporte à tomada de decisão.

Atualmente foco em construir soluções em Python, SQL, estatística aplicada, machine learning supervisionado e aplicações com IA generativa / LLMs, sempre orientado a problemas reais de negócio.


O que é o Small Data Lab

O Small Data Lab é um laboratório pessoal de desenvolvimento e experimentação em Ciência de Dados. Ele funciona como um ambiente estruturado para a construção de Provas de Conceito (POCs) aplicadas a problemas reais de negócio, reunindo estudos e aplicações práticas envolvendo:

  • Análise exploratória de dados (EDA)
  • Modelagem preditiva com machine learning supervisionado
  • Construção de pipelines analíticos
  • Visualização e comunicação de insights
  • Experimentos com IA generativa e LLMs

Cada POC documenta claramente o problema, a abordagem, a solução e os resultados obtidos, formando um portfólio progressivo de aplicações em dados.


O que você encontra neste GitHub

  • Repositórios organizados por problema de negócio.
  • Provas de conceito completas, com notebooks e documentação técnica.
  • Estudos aplicados em Python, SQL, estatística, machine learning e GenAI.

Onde me encontrar

Website LinkedIn Email


Este repositório é licenciado sob a MIT License.


Pinned Loading

  1. campaignsense campaignsense Public

    POC de CRM Analytics focada em modelagem de propensão à resposta, com análise exploratória orientada à decisão, engenharia de atributos e preparação de dados para profit targeting.

    Jupyter Notebook

  2. delayimpact-analytics delayimpact-analytics Public

    Análise diagnóstica do impacto do atraso logístico na satisfação do cliente em e-commerce, baseada em camada Gold modelada em SQL com DuckDB e análise exploratória guiada em Python.

    Jupyter Notebook

  3. doclens doclens Public

    Chatbot RAG baseado em documentos, com controle de escopo, rastreabilidade e mitigação de riscos.

    Python

  4. fraudwatch fraudwatch Public

    POC antifraude baseada em Machine Learning, que demonstra como estruturar modelos como motores de decisão, com avaliação temporal honesta, baseline sólido e comparação entre algoritmos.

    Jupyter Notebook

  5. retaillens-bi retaillens-bi Public

    Dashboard executivo de e-commerce em Power BI, baseado em camada Gold modelada em SQL com DuckDB, com foco em performance logística e financeira.

    Jupyter Notebook

  6. lakeflow lakeflow Public

    Pipeline de engenharia de dados end-to-end com arquitetura lakehouse em camadas e rastreabilidade de execução.

    Python