[发明专利]一种结合指纹抽样和减少数据碎片的数据块路由方法有效

专利信息
申请号: 201610368325.4 申请日: 2016-05-27
公开(公告)号: CN105897921B 公开(公告)日: 2019-02-26
发明(设计)人: 谭玉娟;王奏鸣;晏志超 申请(专利权)人: 重庆大学
主分类号: H04L29/08 分类号: H04L29/08;G06F16/174
代理公司: 暂无信息 代理人: 暂无信息
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提出一种结合指纹抽样和减少数据碎片的用于分布式重复数据删除系统的数据块路由方法。该方法提出对数据块指纹进行抽样,对抽样后的数据块指纹采用布隆过滤器快速地查找重复数据,估算数据重复率,其采用的路由算法结合了数据的重删率、数据节点服务器的碎片量以及存储空间使用率来确定路由节点。与已有的路由方法相比,该方法能提高整个系统的重删率,系统的吞吐率以及数据恢复速度。
搜索关键词: 一种 结合 指纹 抽样 减少 数据 碎片 路由 方法
【主权项】:
1.一种结合指纹抽样和减少数据碎片的数据块路由方法,其特征在于,包括步骤:(1)客户端接收用户需要备份的数据流;(2)客户端对接收到的数据流进行预处理,其中,包括步骤:(2.1)使用数据块变长算法对备份数据流进行分块,得到具有一定平均长度的数据块,并使用哈希算法(SHA‑1)计算每个所述数据块的指纹;(2.2)按照备份数据流中数据块出现的顺序,将连续的数据块依次合并为具有一定平均长度的合并块;(2.3)将所述合并块对应的指纹序列,按固定的采样率进行等距抽样,生成新的指纹序列,将新的指纹序列发送给各个数据节点服务器;(3)数据节点服务器对接收到的所述新的指纹序列进行处理并确定最终路由的数据节点服务器,其中,包括步骤:(3.1)数据节点服务器对接收到的指纹序列进行布隆过滤器查询,得到重复数据块指纹的数量,并计算指纹重复率DN,存储空间使用率UN,以及重复率DN和存储空间使用率UN的比值RN,RN=DN/UN,数据节点服务器将得到的RN值发送给客户端;(3.2)客户端接收每个数据节点服务器的RN值,将步骤(2.2)中得到的合并块的所有指纹发送给RN值最高的K个数据节点服务器;(3.3)数据节点服务器接收到客户端发送的所有数据块指纹之后,查找这些数据块对应的数据碎片,并将数据碎片量返回给客户端;(3.4)客户端接收到对应的数据碎片量之后,选择碎片量最少的一个数据节点服务器,作为最终路由的数据节点服务器;(4)客户端将步骤(2.2)中得到的合并块的所有数据块指纹序列,发送给步骤(3.4)得出的数据节点服务器,对应的数据节点服务器在数据指纹索引表中查找是否存在重复的数据块指纹,若存在,则仅更新数据指纹索引表的块引用数;若不存在,则向客户端索取对应的数据块,将对应的数据块存放在数据节点服务器的数据区域,并将该数据块的指纹,存储地址,以及块引用数添加至数据指纹索引表中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610368325.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top