terça-feira, 27 de março de 2012

Vamos entender as tabelas Fatos e Dimensões.



Acredito que não é possível falar de ferramentas de Business Intelligence (BI) sem antes entender o que é ou como funciona esse ambiente.

Um projeto de BI tem como fator principal auxiliar na tomada de decisão e para isso é necessário transformar conjuntos de dados extensos e geralmente dispersos em conhecimento consolidado, pronto para ser analisado e manipulando de forma efetiva para a tomada de decisão.

Para criar esse tal ambiente consolidado e pronto para tomada de decisão é necessário um trabalho árduo que além de conhecimento teórico é necessário conhecimento do negócio, tento em vista que conhecimento do negócio que é algum que conquistamos no dia a dia, então pretendo fazer um pequeno overview sobre os termos e os conceitos mais utilizados nesse contexto, neste artigo vou falar das tabelas fatos e dimensões.

FATO:
A tabela de fatos é a principal tabela de um modelo dimensional, onde as medições numéricas de interesse da empresa estão armazenadas [KIMBALL, 2002].

Um exemplo clássico para entender uma tabela fato é imaginamos a seguinte situação: Imagine que sua empresa deseja saber de forma rápida e eficaz quais produtos foram vendidos ao longo dos anos para a cliente X em todas regiões brasileiras.
Nessa situação a gente teria a seguinte tabela fato:

FATO_VENDAS
Id_Cliente
ID_Produto
Id_Região
Data_Vend
Quant_Vend
Vlr_Unitario
Vlr_IPI
Vlr_Desc
000123
01
0001
20120326
03
R$ 2.520,00
R$ 126,00
R$ 0,00
000123
03
0002
20110101
10
R$ 700,00
R$ 38,00

000123
04
0003
20101231
12
R$ 200,00

R$ 10,00
000123
01
0004
20120123
06
R$ 1.960,00
R$ 5,74
R$ 0,00
000666
01
0005
20120228
01
R$ 3.444,00
R$ 180,00
R$ 26,00
000666
03
0001
20110201
08
R$ 224,00
R$ 11,00
R$ 0,00

Note que temos campos chaves que servirá para identificar nossas dimensões e também temos valores e dados das vendas.
Com isso podemos concluir que tabela fato é onde temos todos os valores de uma determinada venda (neste caso) e que as chaves que servem para cruzar com as tabelas dimensões.


DIMENSÃO
A qualidade do banco de dados é proporcional à qualidade dos atributos de dimensões, portanto deve ser dedicados tempo e atenção a sua descrição, ao seu preenchimento e a garantia da qualidade dos valores em uma coluna de atributos [KIMBALL,2002].

Em outras palavras as tabelas de dimensões têm descrições textuais de cada elemento que fazem parte do negócio e possui as informações necessárias para análise.
No exemplo citado acima temos três dimensões: Cliente, Produto e Região.
DIM_CLIENTE
Id_Cliente
Nome_Cliente
CNPJ
Endereço
Bairro
Cidade
UF
000123
X
00.000.000/0001-00
Rua São Paulo,263
Pinheiros
São Paulo
SP
000666
TESTE
00.000.000/0002-00
Rua Teste, 111
Lapa
Rio Janeiro
RJ



DIM_PRODUTO
Id_Produto
Nome_Prod
Desc_Prod
Cor_Prod
Id_Fornecedor
01
Caderno
Caderno com 10 mat.
Rosa
001
02
Lápis
Lápis de cor
12 cores
002
03
Caneta
Caneta com pesonagem
Azul
003
04
Borracha
básica
branca
001


DIM_REGIÃO
Id_Região
Região
Desc_Região
0001
Sudeste
Abrange SP, RJ e MG
0002
Centro Oeste
Abrande DF e GO
0003
Nordeste
Todos uf do nordeste
0004
Norte
Exceto PA
0005
Sul
SC, RS, PR


Guardem esse exemplo que nos próximos artigos aplicaremos isso utilizando o Qlikview.

Abraços e até a próxima.