📊 EDA - ESTATÍSTICA DESCRITIVA - DADOS DO DATASET 📊 EDA - ESTATÍSTICA DESCRITIVA - DADOS DO DATASET 📊 EDA - ESTATÍSTICA DESCRITIVA - DADOS DO DATASET 📊 EDA - ESTATÍSTICA DESCRITIVA - DADOS DO DATASET
Segment Country Product Units Sold Sale Price Gross Sales Discounts Sales COGS Profit Segment Country Product Units Sold Sale Price Gross Sales
Government Canada Carretera 1,618 $20 $32,370 $0 $32,370 $16,185 $16,185 Government Germany Carretera 1,321 $20 $26,420
Midmarket Germany Carretera 1,899 $15 $28,485 $2,849 $25,637 $18,990 $6,647 Small Business France Carretera 2,177 $15 $32,655
Government France Paseo 2,803 $350 $981,050 $0 $981,050 $718,850 $262,200 Government Mexico Paseo 2,094 $350 $732,900
Enterprise Mexico VTT 2,473 $250 $618,250 $0 $618,250 $642,875 -$24,625 Enterprise Germany VTT 1,513 $250 $378,250
Small Business USA Amarilla 2,181 $300 $654,300 $65,430 $588,870 $239,910 $348,960 Small Business Canada Amarilla 1,962 $300 $588,600
Channel Partners Canada Montana 2,518 $7 $17,626 $1,763 $15,863 $7,554 $8,309 Channel Partners France Montana 1,899 $7 $13,293
Government Germany Velo 4,492 $120 $539,040 $53,904 $485,136 $224,600 $260,536 Government USA Velo 3,371 $120 $404,520
Enterprise France Paseo 2,717 $350 $950,950 $0 $950,950 $950,625 $325 Enterprise Canada Paseo 1,608 $350 $562,800
Midmarket USA Carretera 1,073 $15 $16,095 $0 $16,095 $10,730 $5,365 Midmarket Mexico Carretera 884 $15 $13,260
Small Business Germany VTT 2,821 $250 $705,250 $70,525 $634,725 $310,310 $324,415 Small Business USA VTT 2,401 $250 $600,250
Government Canada Paseo 3,452 $350 $1,207,500 $0 $1,159,200 $950,625 $208,575 Government Germany Paseo 2,891 $350 $1,011,850

📊 Análise Exploratória de Dados

Automatizada com YData Profiling - Dataset de Vendas e Lucros por Segmento, País e Produto

Sobre o Projeto

Este projeto demonstra minhas capacidades em Análise Exploratória de Dados (EDA) buscando consumir de forma mais eficaz as funcionalidades da biblioteca YData Profiling (anteriormente conhecida como Pandas Profiling).

A análise foi realizada com configurações padrão - sem customizações ou filtros específicos - demonstrando o que a ferramenta oferece "out of the box" para uma análise completa de dados.

Objetivo

Estatísticas Descritivas

Análise completa de todas as variáveis numéricas e categóricas

Valores Ausentes

Detecção e visualização automática de dados faltantes

Correlações

Matriz de correlação entre todas as variáveis numéricas

Alertas Automáticos

Identificação de problemas potenciais nos dados

Sobre o Dataset

700
Registros
16
Variáveis
53
Valores Ausentes
0
Duplicatas
252.6
KB de Memória

Tipos de Variáveis

Tipo Quantidade
Numérica (float64)6
Categórica (object)5
Numérica (int64)4
Data/Hora1

Colunas do Dataset

Variável Tipo Descrição
SegmentCategóricaSegmento de mercado (Government, Enterprise, etc.)
CountryCategóricaPaís da venda
ProductCategóricaNome do produto
Discount BandCategóricaFaixa de desconto aplicada
Units SoldNuméricaUnidades vendidas
Manufacturing PriceNuméricaPreço de fabricação
Sale PriceNuméricaPreço de venda
Gross SalesNuméricaVendas brutas
DiscountsNuméricaValor dos descontos
SalesNuméricaVendas líquidas
COGSNuméricaCusto dos produtos vendidos
ProfitNuméricaLucro
DateDataData da transação
Month NumberNuméricaNúmero do mês
nome_mesCategóricaNome do mês
YearNuméricaAno

Resultados

1️⃣ Overview Geral

Overview do Dataset
Overview geral do dataset gerado pelo YData Profiling

O YData Profiling identifica automaticamente:

2️⃣ Distribuições Numéricas

Distribuições Numéricas
Histogramas das variáveis numéricas

Estatísticas Descritivas Principais

Variável Média Mediana Mín Máx
Units Sold1,6081,5422004,492
Sale Price$118$20$7$350
Gross Sales$182,759$37,980$1,799$1,207,500
Sales$169,609$35,540$1,655$1,159,200
COGS$145,475$22,506$918$950,625
Profit$24,134$9,242-$40,617$262,200

3️⃣ Variáveis Categóricas

Distribuições Categóricas
Distribuição das variáveis categóricas

Distribuição por Segmento

Segmento Quantidade %
Government30042.9%
Small Business10014.3%
Channel Partners10014.3%
Midmarket10014.3%
Enterprise10014.3%

Distribuição por Produto

Produto Quantidade %
Paseo20228.9%
Velo10915.6%
VTT10915.6%
Amarilla9413.4%
Carretera9313.3%
Montana9313.3%

4️⃣ Matriz de Correlação

Matriz de Correlação
Correlações de Pearson entre variáveis numéricas

Top 5 Correlações Mais Fortes

Variável 1 Variável 2 Correlação
Gross SalesSales0.998
Gross SalesCOGS0.995
SalesCOGS0.992
Sale PriceGross Sales0.808
SalesProfit0.806

5️⃣ Interações entre Variáveis

Interações entre Variáveis
Gráficos de dispersão mostrando interações

Os gráficos de dispersão revelam:

6️⃣ Análise de Valores Ausentes

Valores Ausentes
Visualização de valores ausentes no dataset
Variável Ausentes %
Discount Band537.6%
Demais variáveis00%

7️⃣ Resumo de Negócio

Resumo de Negócio
Análise de lucro por segmento e país

Lucro por Segmento

Segmento Lucro Total
Government$11,388,173
Small Business$4,143,168
Channel Partners$1,316,803
Midmarket$660,103
Enterprise-$614,545 ⚠️

Lucro por País

País Lucro Total
🇫🇷 France$3,781,021
🇩🇪 Germany$3,680,389
🇨🇦 Canada$3,529,229
🇺🇸 United States$2,995,541
🇲🇽 Mexico$2,907,523

Alertas Detectados

O YData Profiling detecta automaticamente potenciais problemas nos dados:

Alertas de Correlação

Alerta Variáveis Valor
⚠️ Alta correlaçãoGross Sales ↔ Sales1.00
⚠️ Alta correlaçãoGross Sales ↔ COGS0.99
⚠️ Alta correlaçãoSales ↔ COGS0.99
⚠️ Alta correlaçãoSale Price ↔ Gross Sales0.81
⚠️ Alta correlaçãoSales ↔ Profit0.81
⚠️ Alta correlaçãoSale Price ↔ COGS0.80
⚠️ Alta correlaçãoGross Sales ↔ Discounts0.78
⚠️ Alta correlaçãoGross Sales ↔ Profit0.78
⚠️ Alta correlaçãoDiscounts ↔ COGS0.78
⚠️ Alta correlaçãoDiscounts ↔ Sales0.74
⚠️ Alta correlaçãoCOGS ↔ Profit0.73

Outros Alertas

Valores ausentes: Discount Band possui 53 valores ausentes (7.6%)
Muitos zeros: Discounts possui 7.6% dos registros com valor zero

Insights Principais

  1. Segmento Government domina com 43% dos registros e 67% do lucro total
  2. Enterprise é o único segmento com prejuízo (-$614K)
  3. Alta correlação entre métricas de vendas indica dados consistentes
  4. Discount Band é a única variável com valores ausentes (7.6%)
  5. Paseo é o produto mais vendido (29% das transações)
  6. França lidera em lucro total ($3.78M)
  7. Distribuição equilibrada por país (140 registros cada)