Cloud services for development and data analysis

philipsanakrym 8 views 28 slides Oct 28, 2025
Slide 1
Slide 1 of 28
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13
Slide 14
14
Slide 15
15
Slide 16
16
Slide 17
17
Slide 18
18
Slide 19
19
Slide 20
20
Slide 21
21
Slide 22
22
Slide 23
23
Slide 24
24
Slide 25
25
Slide 26
26
Slide 27
27
Slide 28
28

About This Presentation

Cloud computing


Slide Content

Титульный слайд Лекция 6: Облачные сервисы для разработки и анализа данных Курс: Облачные технологии

План лекции 1. Роль облаков 2. Хранилища и БД 3. ETL и конвейеры 4. ML и MLOps 5. BI и кейсы

Роль облачных сервисов в аналитике Масштабируемость Гибкость Совместная работа

Модели сервисов: IaaS, PaaS, SaaS, DaaS Краткая характеристика каждой модели

Архитектура платформы данных в облаке Data Lake Processing Serving/BI

Облачные хранилища (S3, GCS, Blob) Особенности объектного хранилища Классы хранения

Data Lake vs Data Warehouse Отличия по структуре данных и задачам

Облачные аналитические БД (BigQuery, Redshift, Snowflake) Архитектурные особенности Разделение compute/storage

ETL vs ELT и Data Pipelines Традиционные ETL Современные ELT-подходы

Сервисы для построения конвейеров (Glue, Dataflow, ADF) Ключевые возможности Автоматизация

Интеграция потоковых данных (Kafka, Pub/Sub) Stream processing Use-cases

Платформы для анализа и обработки (Databricks, Synapse) Spark-основанные платформы Collaborative notebooks

Архитектура ноутбука и workspace Notebooks, repos, jobs

Машинное обучение в облаке (SageMaker, Vertex, Azure ML) Тренировка, гиперпараметры, развертывание

Модели развертывания ML: online vs batch Онлайн предсказания Пакетная инференс

MLOps: CI/CD для моделей Versioning, pipelines, monitoring

Feature stores и управление признаками Зачем нужен feature store Consistency between train & serve

Model monitoring и A/B тестирование Метрики drift, latency, accuracy

Serverless для аналитики (Lambda, Functions) Event-driven, lightweight tasks

Data governance и безопасность Access control, encryption, lineage

Data catalog и метаданные Catalogues, schema registry

BI-инструменты и визуализация (Power BI, Looker) Self-service BI Dashboards

Стоимость и оптимизация расходов Spot instances, autoscaling, lifecycle policies

Кейсы: пример end-to-end pipeline Ingest -> Process -> Train -> Serve -> Monitor

Проблемы и ограничения Vendor lock-in, latency, data sovereignty

Тренды и будущее Data mesh, lakehouse, augmented analytics

Ресурсы для самостоятельного изучения Документация провайдеров Курсы, книги, статьи

Вопросы и обсуждение Обсудите кейсы студентов Домашнее задание и оценивание
Tags