返回课程列表
Day 15
Week 3数据工程与 MLOps
数据架构设计
20 分钟安排: 1. 5 分钟:写出你听过的:Data Lake / Data Warehouse。 2. 10 分钟:画一个三层数据分层:Raw / Staging / Curated。 3. 5 分钟:想你的业务里,哪些数据属于哪一层。
🎯学习目标
- 1写出你听过的:Data Lake / Data Warehouse
- 2画一个三层数据分层:Raw / Staging / Curated
- 3想你的业务里,哪些数据属于哪一层
💡核心概念
Data Lake vs Data Warehouse:Data Lake(存储原始数据,支持多种格式)vs Data Warehouse(结构化数据,优化查询)现代架构:Lakehouse(结合两者优势)数据分层:Raw Layer(原始数据,不做处理)、Staging Layer(清洗、标准化)、Curated Layer(业务就绪,可直接使用)
🛠实战提示
画一个数据流图:原始数据 → 清洗 → 特征工程 → 模型训练。思考:哪些数据需要实时处理,哪些可以批处理?
✅20 分钟安排
1. 5 分钟:
2. 10 分钟:
3. 5 分钟:
📚学习资源
📝学习笔记
还没有笔记,开始记录你的学习心得吧