返回课程列表
Day 15
Week 3数据工程与 MLOps

数据架构设计

20 分钟安排: 1. 5 分钟:写出你听过的:Data Lake / Data Warehouse。 2. 10 分钟:画一个三层数据分层:Raw / Staging / Curated。 3. 5 分钟:想你的业务里,哪些数据属于哪一层。

🎯学习目标

  • 1写出你听过的:Data Lake / Data Warehouse
  • 2画一个三层数据分层:Raw / Staging / Curated
  • 3想你的业务里,哪些数据属于哪一层

💡核心概念

Data Lake vs Data Warehouse:Data Lake(存储原始数据,支持多种格式)vs Data Warehouse(结构化数据,优化查询)现代架构:Lakehouse(结合两者优势)数据分层:Raw Layer(原始数据,不做处理)、Staging Layer(清洗、标准化)、Curated Layer(业务就绪,可直接使用)

🛠实战提示

画一个数据流图:原始数据 → 清洗 → 特征工程 → 模型训练。思考:哪些数据需要实时处理,哪些可以批处理?

20 分钟安排

1. 5 分钟:
2. 10 分钟:
3. 5 分钟:

📚学习资源

📝学习笔记

还没有笔记,开始记录你的学习心得吧