[Data Lake + Arquitetura Lambda] na prática

FelipeSantos292 159 views 16 slides Dec 11, 2019
Slide 1
Slide 1 of 16
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16

About This Presentation

Armazenar, catalogar e processar grandes quantidades de dados exigem novas ferramentas e novos processos. Nesta apresentação, mostraremos o conceito (e a prática) de como realizar estas ações de maneira moderna, modular e escalável, utilizando um Data Lake e a Arquitetura Lambda.


Slide Content

Data Lake &
Arquitetura Lambda
Felipe Pereira

www.linkedin.com/in/pereira-felipe/
●Pai, Theo
●Cientista de Dados, Daitan
●Fundador, campData

Arquitetura
Lambda

Arquitetura
Lambda
Batch
Big Data Histórico Raw Data
Real Time
Monitoramento Real Time

Serving Layer

Data Lake &
Arquitetura Lambda &
AWS

Aviso: Arquitetura Lambda ≠ AWS Lambda

Na AWS
Data Lake
●Armazenamento: S3
●Metadata: Glue
Lambda
●Processamento: Kinesis,
Kafka, Spark, etc

Serving
●Data Warehouse: Redshift
●Machine Learning:
Sagemaker
●Analytics: Quicksight, Elastic
●Ad-Hoc: Athena, Redshift
Spectrum, Presto, etc

Na AWS
Data Lake
●Armazenamento: S3
●Metadata: Glue
Lambda
●Processamento: Kinesis,
Kafka, Spark, etc

Serving
●Data Warehouse: Redshift
●Machine Learning:
Sagemaker
●Analytics: Quicksight, Elastic
●Ad-Hoc: Athena, Redshift
Spectrum, Presto, etc

It's demo time!

Obrigado Sr Musk!

Resumo
Lambda
Kinesis Firehose:
●Origem
●Transformação Batch
●Destino
Kinesis Analytics:
●Origem
●Analytics Real Time
●Destino

Data Lake
●Armazenamento: S3
●Particionamento: Kinesis
●Metadados: Glue
Consumo
SQL: Athena

Obrigado!