返回课程列表
Day 11
Week 2模型训练与推理优化
模型服务框架
20 分钟安排: 1. 5 分钟:了解 TorchServe / Triton 的定位。 2. 10 分钟:想象有"一台统一的推理服务器",多个模型挂在上面。 3. 5 分钟:写下各自优点: • TorchServe → PyTorch 生态 • Triton → 多框架 / 多模型 / 高性能
🎯学习目标
- 1了解 TorchServe / Triton 的定位
- 2想象有"一台统一的推理服务器",多个模型挂在上面
- 3写下各自优点:TorchServe → PyTorch 生态;Triton → 多框架 / 多模型 / 高性能
💡核心概念
TorchServe:部署 PyTorch 模型的标准化方式Triton:NVIDIA 推出的通用推理服务器模型热加载 / 热更新:不停机替换模型版本
🛠实战提示
思考:你的"SecondMind"将来是:调别人 API(OpenAI 等)还是挂在你自己的 Triton 集群上?
✅20 分钟安排
1. 5 分钟:
2. 10 分钟:
3. 5 分钟:
TorchServe → PyTorch 生态
Triton → 多框架 / 多模型 / 高性能
📚学习资源
📝学习笔记
还没有笔记,开始记录你的学习心得吧