[发明专利]一种基于决策概率逼近的矩阵对策近似求解方法及装置在审
申请号: | 201710705959.9 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107491418A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 何炼坚;郑翔平;杨家伟;蒋成进;袁双 | 申请(专利权)人: | 中国电子科技集团公司第二十九研究所 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 成都九鼎天元知识产权代理有限公司51214 | 代理人: | 徐静 |
地址: | 610036 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及矩阵对策中的策略确定领域,尤其是一种基于决策概率逼近的矩阵对策近似求解方法及装置。本发明中初始设置一局中人1的策略选择概率向量;针对该局中人1的策略选择概率向量,计算另一局中人2所有策略的期望收益;计算另一局中人2的策略选择概率向量;再针对另一局中人2的策略选择概率向量,计算该局中人1所有策略的期望收益,并基于此计算该局中人1的策略选择概率向量;这样,在两局中人的策略选择概率向量、策略期望收益之间往复迭代计算,当两局中人的策略选择概率向量满足收敛条件时结束迭代,求得两局中人的矩阵对策的近似最优策略。 | ||
搜索关键词: | 一种 基于 决策 概率 逼近 矩阵 对策 近似 求解 方法 装置 | ||
【主权项】:
一种基于决策概率逼近的矩阵对策近似求解方法,其特征在于包括:步骤1:设置该局中人关于其策略集中策略的选择概率向量初始值;该局中人策略选择概率向量初始值各分量之和为1;步骤2:针对该局中人的策略选择概率向量,计算另一局中人所有策略的期望收益;使用最新计算出的另一局中人所有策略的期望收益,计算另一局中人的策略选择概率向量,并通过归一化使策略选择概率向量各分量之和为1;步骤3:针对另一局中人的策略选择概率向量,计算该局中人所有策略的期望收益;使用最新计算出的该局中人所有策略的期望收益,计算该局中人的策略选择概率向量,并通过归一化使策略选择概率向量各分量之和为1;步骤4:通过步骤2及3之间的反复迭代,使得该局中人的策略选择概率向量以及另一局中人的策略选择概率向量收敛,结束迭代,求得该局中人与另一局中人的矩阵对策的近似最优策略。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十九研究所,未经中国电子科技集团公司第二十九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710705959.9/,转载请声明来源钻瓜专利网。