【MindSpore第七期两日集群营】使用Dataflow Fragment进行可扩展分布式训练

打开 https://gitee.com/mindspore/reinforcement/tree/master/example/dqn

MindSpore Reinforcement 是MindSpore提供的强化学习框架,它把强化学习算法转换为一系列编译好的计算图,然后使用MindSpore框架在CPU、GPU或者昇腾芯片上高效运行。

MindSpore_RL_Architecture

要实现MindSpore Reinforcement的强化学习训练,需要先安装MindSpore,然后再安装MindSpore Reinforcement。他们之间的版本依赖有以下的关系:

当然,这次我们暂时不考虑自己去安装这些内容,而是利用MindSpore的羲和完成“运行强化学习DQN算法”的任务

打开 https://xihe.mindspore.cn/projects/VectorSL/MSRL_openday

cke_905.png

点击fork :

cke_1801.png

点击确定。

cke_3067.png

点击 训练-训练列表:

cke_4206.png

点击创建训练实例:

加载 train/config.json文件:

cke_6609.png

修改参数:500个episodes,训练中的eval间隔改为20一次

试试手工修改 https://xihe.mindspore.cn/projects/zhanghui_china/MSRL_openday/blob/train/trainDir/train.py

将原来的650改为500:

cke_11584.png

点击确认,保存:

cke_13612.png

修改该文件,将eval从10改为20

cke_14674.png

按确定后保存。

回到前面创建训练作业的窗口,点击创建。

cke_16777.png

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享