返回课程列表
Day 23
Week 4高级主题与实践
强化学习基础
20 分钟安排: 1. 5 分钟:理解强化学习 2. 10 分钟:学习 Q-Learning 3. 5 分钟:实现简单算法
🎯学习目标
- 1理解强化学习的概念
- 2掌握 Q-Learning
- 3了解策略梯度
💡核心概念
强化学习:智能体与环境交互Q-Learning:值函数学习策略梯度:直接优化策略应用:游戏 AI、机器人控制
🛠实战提示
实现一个简单的 Q-Learning 算法
✅20 分钟安排
1. 5 分钟:
2. 10 分钟:
3. 5 分钟:
📚学习资源
📝学习笔记
还没有笔记,开始记录你的学习心得吧