[发明专利]一种实现大数据处理的方法及装置有效
申请号: | 201310646544.0 | 申请日: | 2013-12-04 |
公开(公告)号: | CN103617268B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 王志军;廖慧 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 栗若木,白莹 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种实现大数据处理的方法及装置,包括在分布式系统基础架构(hadoop)外部环境,利用预先设置的拆分策略拆分hadoop总查询任务;按照拆分的hadoop查询任务,在hadoop的分布式存储系统中分别进行hadoop内部查询;将各内部查询结果按照预先设置的存储策略存储在hadoop外部环境;通过hadoop外部查询方式对存储信息进行统计并显示。本发明还包括与方法相对应的装置,通过本发明在hadoop外部环境对总查询任务进行拆分,在执行完拆分查询任务后,将内部查询结果按照任务拆分进行相应的分级存储,实现hadoop大数据访问的分页浏览和在不影响系统性能下进行数据统计。 | ||
搜索关键词: | 一种 实现 数据处理 方法 装置 | ||
【主权项】:
一种实现大数据处理的方法,其特征在于,包括:在分布式系统基础架构hadoop外部环境,利用预先设置的拆分策略拆分hadoop总查询任务;按照拆分的hadoop查询任务,在hadoop的分布式存储系统中分别进行hadoop内部查询;将各内部查询结果按照预先设置的存储策略存储在hadoop外部环境;通过hadoop外部查询方式对存储信息进行统计并显示;其中,所述进行统计的方法包括:对各拆分任务的内部查询结果的每一页进行查询统计,并将各拆分任务每一页内部查询结果的查询统计信息进行合并,得到相应拆分任务的统计信息;将相应拆分任务的统计信息进行合并,得到总查询任务的统计结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310646544.0/,转载请声明来源钻瓜专利网。
- 上一篇:全自动菌类生产机械
- 下一篇:信息处理设备、程序、信息处理方法和信息处理系统