[发明专利]用来加速稀疏矩阵乘密集向量以及稀疏向量乘密集向量乘法的存储器到存储器指令有效
申请号: | 201711374037.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108205433B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | E.格罗乔夫斯基;A.米什拉;D.马尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F7/57 | 分类号: | G06F7/57;G06F9/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 郑浩;杨美灵 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 可确定要与稀疏阵列的第一行的第一元素相乘的密集向量的第一元素。密集向量的所确定第一元素可写到存储器中。可通过相乘稀疏阵列的第一元素的子集和密集向量的第一元素的对应子集,按照多个增量来计算稀疏阵列的第一元素和密集向量的第一元素的点积。可在每个增量被完成之后更新序列号,以标识对于其点积计算已经被完成的稀疏阵列的列号和/或行号。 | ||
搜索关键词: | 用来 加速 稀疏 矩阵 密集 向量 以及 乘法 存储器 指令 | ||
【主权项】:
1.一种方法,包括:确定要与稀疏阵列的第一行的第一元素相乘的密集向量的第一元素;将所述密集向量的所述第一元素写到存储器中;计算所述稀疏阵列的所述第一元素和所述密集向量的所述第一元素的点积,其中,所述点积按照多个增量来计算,其中每个增量包括所述稀疏阵列的所述第一元素的子集和所述密集向量的所述第一元素的对应子集的乘法;以及在每个增量被完成之后更新序列号,其中所述序列号标识对于其所述点积已经被完成的所述稀疏阵列的列号和行号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711374037.0/,转载请声明来源钻瓜专利网。