[发明专利]一个基于强化学习的自适应规则的生成和管理框架有效
申请号: | 201610239316.5 | 申请日: | 2016-04-18 |
公开(公告)号: | CN105956680B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 金芝;赵天琪;张伟;赵海燕 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F9/00 | 分类号: | G06F9/00 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 杨海明 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习的生成和管理自适应规则的框架。该框架在自适应场景和强化学习算法之间建立起映射关系,它包括设计和运行两个阶段的活动:设计阶段使用强化学习算法,针对多个具有代表性的目标设定分别生成自适应规则;运行阶段利用基于案例的推理找到并激活最适合当前目标设定的自适应规则,同时使用强化学习算法不断更新自适应规则。本发明的技术效果在于能够改善传统的基于规则的自适应方法:1、提供了一种自适应规则的自动生成算法,能够保证生成的规则与目标相匹配;2、提供了一种自适应规则的演化算法,能够使得规则集在目标发生变化后进行与之相匹配的演化。 | ||
搜索关键词: | 一个 基于 强化 学习 自适应 规则 生成 管理 框架 | ||
【主权项】:
一个生成和管理自适应规则的框架,它包括设计和运行两阶段的活动,其中设计阶段的活动包括如下步骤:1)选择多个具有代表性的目标设定,对其中的每个目标设定分别执行以下步骤;2)基于目标设定建立强化学习问题的奖励函数;3)对运行时的环境情况进行模拟;4)使用强化学习算法学习得到价值函数和自适应规则集合;5)将该目标设定及生成的价值函数、自适应规则作为一个案例存入案例库。对组合中的全部目标设定都学习完后算法结束;
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610239316.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种高效过滤精矿压滤机脱水系统
- 下一篇:一种雨水沉沙池装置