[发明专利]一种基于深度强化学习的多车队列控制方法在审
申请号: | 202110054062.0 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112801149A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 陈龙;陆思凯;蔡英凤;高翔;高洪波;刘卫国;王海;熊晓夏 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于深度强化学习的多车队列控制方法,将堆叠4帧的状态量作为网络的输入,使用车队共享网络的训练方法产生训练样本填充经验池;在训练过程中每个周期结束时对经验池进行备份;在经验池中进行采样训练网络。本发明使用车队共享网络,多车同时参加训练的训练方法,车队成员同时产生训练样本,大幅度缓解了连续动作空间探索效率低下的问题,利用探索过程中随机噪声带来的车队间车速震荡使获得的训练样本多样性更好,模型可以应对更加复杂的工况。使用时序信息,堆叠4帧状态量作为网络输入,增强网络的鲁棒性。提出经验池备份方法,通过对经验池的备份和覆盖,剔除非法周期产生的样本,防止低效的样本抽取劣化训练效果。 | ||
搜索关键词: | 一种 基于 深度 强化 学习 车队 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110054062.0/,转载请声明来源钻瓜专利网。
- 上一篇:入侵植物竞争优势度量化方法
- 下一篇:清洁机器人的清洁转盘及清洁机器人