返回课程列表
Day 23
Week 4高级主题与实践

强化学习基础

20 分钟安排: 1. 5 分钟:理解强化学习 2. 10 分钟:学习 Q-Learning 3. 5 分钟:实现简单算法

🎯学习目标

  • 1理解强化学习的概念
  • 2掌握 Q-Learning
  • 3了解策略梯度

💡核心概念

强化学习:智能体与环境交互Q-Learning:值函数学习策略梯度:直接优化策略应用:游戏 AI、机器人控制

🛠实战提示

实现一个简单的 Q-Learning 算法

20 分钟安排

1. 5 分钟:
2. 10 分钟:
3. 5 分钟:

📚学习资源

📝学习笔记

还没有笔记,开始记录你的学习心得吧