Modelagem multidimensional conceitos básicos

TANIARESENDE 2,873 views 28 slides May 30, 2016
Slide 1
Slide 1 of 28
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28

About This Presentation

Conceitos básicos sobre modelagem multidimensional


Slide Content

Modelagem Multidimensional
Conceitos Básicos

Tomada de Decisão Gerencial
•Éa escolha racional, dentre alternativas disponíveis, de um
curso de ação, que se faz presente em todos os níveis da
organização (estratégico, gerencial e operacional).
•Identificar e selecionar um curso de ação para lidar com um
problema específico ou extrair vantagens em uma
oportunidade.

Sistemas de apoio à Decisão Gerencial
Transformar dados em informações de suporte à decisão;
Auxiliar na tomada de decisões estratégicas e táticas;

DATA WAREHOUSE –Armazém de Dados
Bill Inmon : “É um banco de dados,
orientado por assunto, integrado, não
volátil e histórico, criado para suportar o
processo de tomada de decisão.”
Ralph Kimball : “Umarmazémé
umacópiados dados da
transaçãoespecificamente estruturado
para consultae análise.”

DATA MART –Repositório de Dados
Bill Inmon : “Data Mart é cada uma das
partes físicas ou lógicas de um Data
Warehouse corporativo. Um Data Mart
corresponde às necessidades de
informação de uma determinada
comunidade de usuários.”

DATA MART –Repositório de Dados
Arquitetura Top-Down
Bill Inmon
Arquitetura Botton-Up
Ralph Kimball

Granularidade

Granularidade

ETL –ExtractTransformLoad
Extração Transformação e Limpeza Transform
Staging Area Load
Data Mart Usuário Final

Extração
1.Fonte: Considerar dados oriundos dos sistemas
transacionais
2.Meio de acesso ao sistema fonte: através de views
3.Horário da extração: fora do horário comercial. Deve constar
no FLD –Formulário de Levantamento de Dados
4.Montar esquema de tabelas de staging
5.Periodicidade da extração: horária, diária, semanal, mensal.
Deve constar no documento de requisitos

Transformação
1.Conversões de formatos: EBCDIC, ASCII, códigos
geográficos (estados, países), conversões de medidas, caixa
alta, etc.
2.Criação de dados derivados (Ex.: UEN Prestadora: obtida
pelo tipo da unidade e a UF)
3.Separação e concatenação de dados, como quebra de
datas, endereços, etc.
4.Limpezas de erros de entrada de dados (typing),
inconsistência entre atributos com valores associados;
campos ausentes; duplicação de informações com
inconsistência entre fontes; aplicação de regras de negócio

Carga
1.Identificar os dados a serem carregados, mapeando o
esquema de stagingcom o esquema dos modelos
dimensionais
2.Tratar o mapeamento de chaves naturais para chaves
surrogates
3.Carregar as dimensões
4.Carregar tabelas fato
5.Considerar aspectos de performance, como uso de
paralelismo, presença ou ausência de índices e constraints
6.Considerar armazenar dados rejeitados, erros em tabelas de
violação

Modelagem Multidimensional
T
Técnica de modelagem onde as
informações se relacionam de
maneira que podem ser
representadas metaforicamente
como um cubo.

Questões de Negócio
Como nasce o modelo multidimensional ?

Questão de negócio:
•Qual a quantidade de objetos do serviço Remessa
Expressaextraviados/roubados e devolvidos ao
remente, por DR de destino, por período (data de
apuração), e por agrupamento de eventos
finalizadores?

Objetos Extraviados/Roubados e Devolvidos ao
Remetente

Fato de Negócio: Remessa Expressa

Questão de Negócio
•Qual a quantidade exportada por Tipo de Malote, por DR
Origem, por DR de Destino e por período?

Quantidade Malotes Exportados

Fato de Negócio: Malotes Exportados

O que é Modelagem Multidimensional ?
“Cruzamento de dimensões de análise para achar uma métrica.”
Carlos Caldo

Elementos de um Modelo Multidimensional
FATO
DIMENSÃO
MÉTRICAECT_TD_TEMPO
TEM_NU_ID_TEMPO
TEM_DT_TEMPO
TEM_DT_JULIANA
TEM_IC_FERIADO_NACIONAL
TEM_SG_DIA_SMNA
TEM_NO_DIA_SMNA
TEM_MM
TEM_DD_MES
TEM_NO_DIA
TEM_NU_DIA_SMNA
TEM_DD_ANO
TEM_NU_SMNA_MES
TEM_NU_SMNA_ANO
TEM_NO_COMPLETO_MES
TEM_NO_ABREVIADO_MES
TEM_NU_MES_ANO
REMESSA_EXPRESSA_FAT
TEM_NU_ID_TEMPO (FK)
ORG_NU_ID_ORGAO (FK)
cli_nu_identificador (FK)
rem_qt_objeto
ECT_DIM_ORGAO
ORG_NU_ID_ORGAO
ORG_NU_ORGAO
ORG_NU_ORGAO_NIVEL_1_TEC
ORG_NO_ORGAO_NIVEL_1_TEC
ORG_NU_ORGAO_NIVEL_2_TEC
ORG_NO_ORGAO_NIVEL_2_TEC
ORG_NU_ORGAO_NIVEL_3_TEC
ORG_NO_ORGAO_NIVEL_3_TEC
ORG_NU_ORGAO_NIVEL_4_TEC
ORG_NO_ORGAO_NIVEL_4_TEC
ORG_NU_ORGAO_NIVEL_5_TEC
ORG_NO_ORGAO_NIVEL_5_TEC
ORG_NU_ORGAO_NIVEL_6_TEC
ORG_NO_ORGAO_NIVEL_6_TEC
ORG_NU_ORGAO_NIVEL_7_TEC
ORG_NO_ORGAO_NIVEL_7_TEC
ORG_NU_ORGAO_NIVEL_8_TEC
ORG_NO_ORGAO_NIVEL_8_TEC
ORG_NU_ORGAO_NIVEL_9_TEC
ORG_NO_ORGAO_NIVEL_9_TEC
ORG_NU_ORGAO_NIVEL_10_TEC
ORG_NO_ORGAO_NIVEL_10_TEC
ORG_NU_ORGAO_NIVEL_1_ADM
CLIENTE_DIM
cli_nu_identificador
cli_co_origem
cli_no
cli_dt_carga
cli_in_registro_corrente

Tipos de métricas

Tipos de Modelos Multidimensionais
Modelo Star Schema

Modelo Star Schema

Tipos de Modelos Multidimensionais
Modelo SnowFlake

Roteiro para uma Modelagem Eficaz

FIM
Tags