可定制算法和环境,这个开源强化学习框架火了
程序员大白
共 2178字,需浏览 5分钟
·
2021-11-29 23:29
点击上方“程序员大白”,选择“星标”公众号
重磅干货,第一时间送达
提供 20 + 种强化学习算法和多种强化学习环境;
算法和环境可定制;
可以添加新的算法和环境;
使用 ray 提供分布式 RL 算法;
算法的基准测试是在许多 RL 环境中进行的。
git clone https://github.com/kakaoenterprise/JORLDY.git
cd JORLDY
pip install -r requirements.txt
# linux
apt-get update
apt-get -y install libgl1-mesa-glx # for opencv
apt-get -y install libglib2.0-0 # for opencv
apt-get -y install gifsicle # for gif optimize
cd jorldy
# Examples: python [script name] --config [config path]
python single_train.py --config config.dqn.cartpole
python single_train.py --config config.rainbow.atari --env.name assault
# Examples: python [script name] --config [config path] --[optional parameter key] [parameter value]
python single_train.py --config config.dqn.cartpole --agent.batch_size 64
python sync_distributed_train.py --config config.ppo.cartpole --train.num_workers 8
推荐阅读
关于程序员大白
程序员大白是一群哈工大,东北大学,西湖大学和上海交通大学的硕士博士运营维护的号,大家乐于分享高质量文章,喜欢总结知识,欢迎关注[程序员大白],大家一起学习进步!
评论