Título do slide
Alinhando
as
expectativas
https://www.menti.com/alb75r
533vjb
AGENDA
01
Conceitos de Análise de Dados
Conceitos Importantes de Visualização de Dados
5
02
.
Introdução a Power BI (Definição e Instalação)
ETL/Visualização
03.
Relacionamento
04.
Análise com DAX
(Data AnalysisExpressions)
05.
Data Analytics
1.
Data Analysis
Conceitos
6
Mapa da Cólera por John Snow(1854)
Big Picture
9
As eras das análise de dados
Dados pequenos,
estruturados e
estáticos
Analistas de back-
office
Lento, meticuloso,
decisões internas
Análise descritiva
Hipóteses humanas
Dados grandes, não
estruturados e em
movimento rápido
Ascensão dos
cientistas de dados
Produtos de dados
em empresas online
Ascensão do
Hadoope código
aberto
Análise visual
"Ágil é muito lento"
Mistura de todos os
dados
Interno/externo/prod
utos/decisões
Análise um recurso
essencial
Mova-se em
velocidade e escala
Análise preditiva e
prescritiva
Análise
incorporada,
invisível,
automatizada
Tecnologias
cognitivas
"Automação de
processos
robóticos" para
tarefas digitais
Davenport, T. (2016). Analytics and IT new opportunity for
CIOs.Harvard Business Review.
Análise Exploratória
Observar as características dos
dados e seus relacionamentos
Como uma variável está
distribuída
Categorias, tendências médias,
variação temporal e
cruzamentos entre informações
●
Prever uma ou mais variáveis
de interesse, com base em
padrões observados
●
Fatores que influenciam no
fenômeno alvo●
Busca de Padrões
Modelos Preditivos
O QUE SÃO DADOS?
Dados sãoum conjunto de valoresformados
a partirdo cruzamentode casoscom
variáveis
Dado é o resultado de investigação, cálculo ou
pesquisa
Variável é toda característica
que pode
assumir diversos valores
conforme pessoa,
objetooucoisa.
Unidade elementar é qualquer
pessoa,
objeto ou coisa que faça parte de
uma
população.
Variável
Quantitativa
Qualitativa
Ou Categórico
Ou Numérico
Representam características de um
indivíduo, objeto ou elemento que não
pode ser medidas ou quantificadas
Representam características de um
indivíduo, objeto ou elemento
resultante de uma contagem (conjunto
finito de valores) ou de uma
mensuração (conjunto infinito de
valores).
“33% dos acidentes de trânsito
envolvem pessoas embriagadas.
Portanto 67% das pessoas
envolvidas em acidentes estão
sóbrias. Logo, devemos dirigir
bêbadosque é mais seguro.”
380
400
500
600
0
100
200
300
400
500
600
700
setembro outubro novembro dezembro
Nº de Clientes
Nº de Clientes
Lançamento da nova feature
(funcionalidade) do aplicativo
360
380
400
500
600
520
450
410
380
400
500
600
0
100
200
300
400
500
600
700
Nº de Clientes
Nº de Clientes
Campanha de mídia paga em
redes sociais
1.
Visualização de
dados
21
22
23
24
25
26
27
28
Storytellingcom Dados
1. A importância do contexto
7. Dissecagemde modelos visuais
2. A escolha de um visual eficaz
6. Pense como um designer
3. A saturação é sua inimiga!
8. Lições sobre storytelling
4. Focalize a atenção de seu público
Analise
Exploratória
Versus
Explanotória
.
29
30
Aimportância do contexto
Quem, o quê e como.
31
A escolha de um
visual eficaz
32
33
Gráfico de dispersão
34
Gráfico de linhas
35
36
Gráfico de barras verticais empilhadas
37
Gráfico de cascata
38
Gráfico de barras horizontais
39
Gráfico de barras horizontais empilhadas
40
41
Fuja da saturação!
Carga Cognitiva
A carga cognitiva pode ser
considerada o esforço mental
exigido para aprender
novas informações..
Principais Elementos
Saturação
São aqueles elementos visuais
que ocupam espaço, mas não
aumentam o entendimento.
42
Percepção Visual
43
44
Proximidade
45
Similaridade
46
Acercamento
47
Acercamento
48
Continuidade
49
Exemplos
50
Exemplos
51
Exemplos
52
Exemplos
MEDIDAS -RESUMO
Medidas de posição central
.
Mediana
Moda
Média
Medidas de dispersão
.
Amplitude
Desvio-médio
Variância
Desvio-padrão
Medidas de ordenamento
.
Mediana
Quartis
Decis
Centisou Percentis
55
Não só existe a média aritmética
Média Harmônica
Ideal para taxas ou proporções
Média Geométrica
Ideal para taxa de crescimento
ao longo do tempo
56
Nem tudo é média
57
Storytelling
Fluxo de Narativa
MEIOINÍCIO FIM
58
CHAMADA PARA AÇÃOPONTOS DE COMPARAÇÃOO AMBIENTE
2.
Power BI
Conceituação
59
Sistema de Informação
Um sistema de inteligência de
negócios (BI) é comumente
conhecido como um conjunto
de soluções tecnológicas que
facilita às organizações
acumular, integrar e analisar
vastos estoques de dados para
entender suas oportunidades,
pontos fortes e fracos .
60
Business
Intelligence
É uma combinação de
ferramentas, como data
warehouse, processamento
analítico online (OLAP) e
painéis.
61
Ain, N., Vaia, G., DeLone, W. H., & Waheed, M. (2019).
Two decades of research on business intelligence system
adoption, utilization and success–A systematic literature
review.Decision Support Systems,125, 113113.
Componentes
Data Warehouse
Reúne dados precisos,
limpos e detalhados de
várias fontes para
análise aprofundada
Processamento
analítico online
Oferece suporte à
análise
multidimensional em
tempo real e permite
que os usuários
apliquem operações
como agregação,
filtragem, roll-upe
downdrillpara
detalhes
Painel
aplicativo front-end
para visualização de
dados e
gerenciamento de
desempenho.
62
63
O QUE É POWER BI?
Por que
Power BI?
[64]
Fonte
65
O QUE É POWER BI?
Data Analytics & Biga Data
[66]
Como analisa isso?
Data Source ETL
Data
Warehouse
Análisede
dados
Visualização
dos dados
2.
Extração e
Transformação
Conceituação
67
Pipeline de dados
[68]
ETL –Extract,Transform& Load
Load
CRM
Filas
Legados Files
SGBD
Cloud
Clean Analyse
Pipeline de dados
[69]
ELT –Extract,Load& Transform
Load
CRM
Filas
Legados Files
SGBD
Cloud
Observações Atípicas (Outlier)
São observações com uma
combinação única de
características
identificáveis como sendo
notavelmente diferente das
outras observações.
Não podem ser
categoricamente
caracterizadas como benéficas
ou problemáticas.
É importante averiguar seu tipo
de influência.
1º Erro de procedimento
(erro na entrada de dados ou uma falha na codificação)
2º Resultado de um evento extraordinário detectável
3º Observações extraordinárias inexplicáveis
4º Observações com valores possíveis, mas com combinação
extraordinária entre as variáveis.
75
Boxplot
Se as observações atípicas são
eliminadas, o analista de dados
corre o risco de melhorar a
análise multivariada, mas limita
sua generalidade.
Eliminação dos outliers
Devem ser mantidas, a menos
que exista prova demonstrável
de que estão verdadeiramente
fora do normal e que não são
representativas de quaisquer
observações na população.
Técnicas a serem implementadas:
Trimmingou Winsorinzing(Hawkings, 1980)
Eliminação dos outliers
10, 15,16,17,22
Trimming Winsorinzing
15,16,17 15, 15,16,17,17
Dados faltantes (missing value)
A preocupação primária do analista de dados é
determinar as razões inerentes aos dados perdidos.
O analista deve compreender os processos que
conduzem os dados perdidos a fim de selecionar o
curso de ação apropriado.
Ações corretivas para os dados faltantes (missingvalue)
Incluir somente observações com dados
completos.
Eliminar as variáveis problemáticas.
Utilizar métodos de atribuição.
Utilizar métodos de atribuição
O método de atribuição é um processo de estimação de valores perdidos com base em valores
válidos de outras variáveis e/ou observações na amostra. Principais métodos de atribuição:
Substituição por um caso
Substituição por média
Atribuição por regressão.
4.
Análise com DAX
Data AnalysisExpressions
81
O que é DAX?
DAX ou Expressões de Análise de Dados direcionam todos os cálculos
que você pode executar no Power BI. As fórmulas DAX são versáteis,
dinâmicas e muito poderosas –elas permitem que você crie novos
campos e até mesmo novas tabelas em seu modelo. Embora o DAX seja
mais comumente associado ao Power BI, você também pode encontrar
fórmulas DAX no Power Pivotno Excel e no SQL Server AnalysisServices
(SSAS).
82
O que é DAX?
As fórmulas DAX são compostas por 3 componentes principais e este
tutorial abordará cada um deles:
Sintaxe–A sintaxe DAX adequada é composta de uma variedade de
elementos, alguns dos quais são comuns a todas as fórmulas.
Funções–As funções DAX são fórmulas predefinidas que recebem
alguns parâmetros e realizam um cálculo específico.
Contexto–O DAX usa o contexto para determinar quais linhas devem ser
usadas para executar um cálculo.
83
Por que o DAX é importante no Power BI?
As fórmulas DAX permitem que você aproveite ao máximo seus dados e
o Power BI para resolver problemas de negócios de forma eficiente.
Você pode executar cálculos simples (como uma soma simples ou
média) e criar a maioria dos visuais sem nem tocar no DAX.
Por exemplo, se você quisesse criar um gráfico simples mostrando o
lucro total, você poderia simplesmente arrastar o campo de lucro para a
seção Valores do gráfico, e ele executaria uma soma das linhas naquele
campo.
84
Há dois casos em que seria melhor criar uma fórmula DAX:
Se você quisesse reutilizar uma
fórmula em vários lugares, como
em vários gráficos ou como uma
expressão em outras fórmulas
DAX. Nesse caso, usar uma
fórmula DAX tornaria seu
relatório mais eficiente e fácil de
alterar no futuro, já que você só
precisaria alterar uma única
fórmula em vez de alterar muitas
fórmulas individuais em cada
lugar em que elas são usadas.
Se você quisesse criar
fórmulas complexas ou
personalizadas onde apenas
uma simples SOMA ou
MÉDIA não seria suficiente
para o problema de
negócios que você estava
tentando resolver.
85
Onde as fórmulas DAX são usadas no Power BI?
Há três maneiras de usar fórmulas DAX no Power BI:
Tabelas calculadas -Esses cálculos adicionarão uma tabela
adicional ao relatório com base em uma fórmula.
Colunas Calculadas -Esses cálculos adicionarão uma coluna
adicional a uma tabela com base em uma fórmula. Essas colunas
são tratadas como qualquer outro campo na tabela.
Medidas -Esses cálculos adicionarão um resumo ou uma medida
agregada a uma tabela com base em uma fórmula.
86
Onde as fórmulas DAX são usadas no Power BI?
Há três maneiras de usar fórmulas DAX no Power BI:
Tabelas calculadas -Esses cálculos adicionarão uma tabela
adicional ao relatório com base em uma fórmula.
Colunas Calculadas -Esses cálculos adicionarão uma coluna
adicional a uma tabela com base em uma fórmula. Essas colunas
são tratadas como qualquer outro campo na tabela.
Medidas -Esses cálculos adicionarão um resumo ou uma medida
agregada a uma tabela com base em uma fórmula.
87
Como escrever uma fórmula
DAX
Função de agregação
Nome medida
Função de
agregação
Tabela ref.
Como escrever uma fórmula DAX
As funções DAX também podem ser aninhadas umas dentro das
outras para executar várias operações de forma eficiente.
Isso pode economizar muito tempo ao escrever fórmulas DAX.
Por exemplo, geralmente é útil ter várias instruções IF aninhadas
ou usar a função IFERROR para envolver outra função, de modo
que quaisquer erros na fórmula sejam representados pelo valor
que você especificar
89
Compreendendo o contexto em fórmulas DAX
Existem dois tipos principais de contexto no
DAX:
■
contexto de linha
■
contexto de filtro.
90