模型服务框架

20 分钟安排： 1. 5 分钟：了解 TorchServe / Triton 的定位。 2. 10 分钟：想象有"一台统一的推理服务器"，多个模型挂在上面。 3. 5 分钟：写下各自优点： • TorchServe → PyTorch 生态 • Triton → 多框架 / 多模型 / 高性能

🎯学习目标

TorchServe：部署 PyTorch 模型的标准化方式Triton：NVIDIA 推出的通用推理服务器模型热加载 / 热更新：不停机替换模型版本

思考：你的"SecondMind"将来是：调别人 API（OpenAI 等）还是挂在你自己的 Triton 集群上？

1. 5 分钟：

2. 10 分钟：

3. 5 分钟：

TorchServe → PyTorch 生态

Triton → 多框架 / 多模型 / 高性能

X/Twitter: @NVIDIAAI, @PyTorch

还没有笔记，开始记录你的学习心得吧