Google发布最新开源强化学习框架

导读	据 VentureBeat 报道，强化学习是一种人工智能(AI)技术，它利用奖赏(或惩罚)来驱动代理朝着特定的目标前进。DeepMind 就是利用这种学习方式 AlphaGo。

据 VentureBeat 报道，强化学习是一种人工智能(AI)技术，它利用奖赏(或惩罚)来驱动代理朝着特定的目标前进。DeepMind 就是利用这种学习方式 AlphaGo。但是强化学习框架存在一些问题，比如需要花很多时间来掌握一个目标，而且总是不灵活，也不稳定。

针对真个问题，Google 提出一个替代方案：基于其机器学习库 TensorFlow 的开源强化学习框架。该强化学习框架基于灵活性、稳定性和重现性三个基本原则开发，目前已发布在 GitHub 上。

除了该开源框架外，Google 还推出了一个网站，允许开发人员能快速将针对多个代理的培训运行进行可视化。它还提供经过训练的模型、原始统计日志和 TensorFlow 事件文件，用于与 TensorBoard 一起绘图，TensorBoard 是 Google 开发的用于 TensorFlow 程序的可视化工具套件。

原文来自：

本文地址： //q13zd.cn/google-study-frame.html编辑：薛鹏旭，审核员：逄增宝

本文原创地址：//q13zd.cn/google-study-frame.html编辑：薛鹏旭，审核员：暂无

bst365最新正规买球

Google发布最新开源强化学习框架

为您推荐一些与本文相关的文章：