33

深度强化学习入门难?这份资料手把手教会你

 5 years ago
source link: https://www.tuicool.com/articles/reuYRvq
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

深度强化学习 是强化学习中的重要研究领域。这一技术使用深度神经网络,提升智能体在训练中的表现。而目前深度强化学习教程较为零散,使得入门这一领域较为困难。近日,两位来自韩国的机器学习研究员整理了深度强化学习的相关教程和代码,并在 GitHub 上开源。代码基于 PyTorch,用户可以在 Colab 中运行。这一项目在 Reddit 上获得高赞。

教程地址:https://github.com/Curt-Park/rainbow-is-all-you-need

教程里有什么

根据 GitHub 页面的介绍,教程总共分为八个章节,从 DQN 开始,逐渐深入,最终一章为彩虹模型。每个章节都包括理论介绍和面向对象的实现。

以第一章的 DQN 代码为例:

1. 定义一个由三个全连接层组成的网络,将这一网络作为智能体的主体:

v2UbAz3.png!web

2. 定义智能体等,其中「select_action」函数定义选择策略的方式,「step」定义每一步智能体和环境交互获得的 reward,「update_model」定义梯度下降的方法。

YFNVryR.png!web

NBB3Ina.png!web

教程目录

1. DQN

2. DoubleDQN

3. 优先经验回放(PrioritizedExperienceReplay)

4. DuelingNet

5. NoisyNet

6. CategoricalDQN

7. N-步学习(N-stepsLearning)

8. 彩虹模型(Rainbow)

安装方法

怎样使用这份教程呢?首先,用户需要从 GitHub 克隆代码并进入项目目录:

git clone https://github.com/Curt-Park/raibow-is-all-you-need.git
cd rainbow-is-all-you-need

接下来安装项目依赖即可:

make dep

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK