CoachPython 强化学习研究框架

联合创作 · 2023-09-26 04:16

Coach 是 Intel Nervana 开源的一个强化学习研究框架，包含许多最先进的算法的实现。该框架利用多核 CPU 处理能力，用于训练和评估增强学习 Agent。Coach 包含一些领先的增强学习算法的多线程实现，适用于各种游戏和机器人环境。

Coach 是一个 Python 环境，有了 Coach，我们就有可能通过结合不同的模块对智能体建模了，也能在不同的环境中训练智能体。可使用的环境，让我们能在不同的实务领域测试智能体，比如机器人、自动驾驶汽车、游戏等。Coach 能够收集训练过程的统计数据，并支持高级可视化技术，从而 debug 训练的智能体。

Coach 有非常易于使用的 API，用于实验新的 RL 算法，并允许新环境的简单集成来解答。基本的 RL 组件（算法、环境、神经网络架构、探索策略等）能很好的解耦，因此能无痛扩展和重用现有的组件。

简单示例：

python coach.py -p CartPole_DQN -r

浏览 36

点赞

收藏

分享

举报

评论

图片

表情

CoachPython 强化学习研究框架

Coach是Intel Nervana开源的一个强化学习研究框架，包含许多最先进的算法的实现。该框架利用多核CPU处理能力，用于训练和评估增强学习Agent。Coach包含一些领先的增强学习算法的多线

RL CoachPython 强化学习框架

RL Coach 是一个Python 强化学习框架，由英特尔 2017 年推出，包含许多最先进算法的

RL CoachPython 强化学习框架

RLCoach是一个Python强化学习框架，由英特尔2017年推出，包含许多最先进算法的实现。RLCoach只是英特尔真正的人工智能生态系统中的几个工具之一。它以模块化的方式对代理和环境之间的交互进

AdeptRLAI 强化学习框架

Adept是一种强化学习框架，旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供：多GPU训练使用自定义网络，代理和环境的模块化界面PyTorch的基线强化学习模型和算法内置张量板日志记录

AdeptRLAI 强化学习框架

Adept 是一种强化学习框架，旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供：多G

MindSpore Reinforcement强化学习框架

MindSporeReinforcement是一个开源的强化学习框架，支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的AP

PARL高性能强化学习框架

PARL是一个高性能、灵活的强化学习框架。PARL的目标是构建一个可以完整复杂任务的智能体。下载安装命令##CPU版本安装命令pipinstall-fhttps://paddlepaddle.org.

MindSpore Reinforcement强化学习框架

MindSpore Reinforcement是一个开源的强化学习框架，支持使用强化学习算法对age

PARL高性能强化学习框架

PARL 是一个高性能、灵活的强化学习框架。PARL 的目标是构建一个可以完整复杂任务的智能体。下载

Gym StarCraft阿里强化学习研究平台

Gym StarCraft 是阿里开源的一套专业易用的研究平台，AI 和强化学习研究者可以非常方便地

点赞

收藏

分享

举报