Proximal_Policy_Optimization - 源码下载|数值算法/人工智能|人工智能/神经网络/遗传算法|源代码

强化学习可以按照方法学习策略来划分成基于值和基于策略两种。而在深度强化学习领域将深度学习与基于值的Q-Learning算法相结合产生了DQN算法，通过经验回放池与目标网络成功的将深度学习算法引入了强化学习算法。(Reinforcement learning can be divided into value-based learning and strategy based learning according to method learning strategies. In the field of deep reinforcement learning, dqn algorithm is generated by combining deep learning with value-based Q-learning algorithm. Through experience playback pool and target network, deep learning algorithm is successfully introduced into reinforcement learning algorithm.)

下载文件列表

文件名	大小	更新时间
Proximal_Policy_Optimization	0	2019-04-08
Proximal_Policy_Optimization\discrete_DPPO.py	8808	2019-01-21
Proximal_Policy_Optimization\DPPO.py	8270	2019-01-21
Proximal_Policy_Optimization\simply_PPO.py	6458	2019-01-21

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

压缩解压

STL

数据结构常用算法

数学计算/工程计算

人工智能/神经网络/遗传算法

matlab例程

生物技术

密码/编码算法

mathematica

Maple

数据挖掘

大数据

comsol

物理计算

化学计算

仿真建模

在结果中搜索

文件名称:Proximal_Policy_Optimization

介绍说明－－下载内容均来自于网络，请自行研究使用

下载文件列表

相关说明

相关评论

发表评论

源码中国 www.ymcn.org

*主　　题：
*内　　容：
*验证码：