[发明专利]基于Lucene的倒排索引系统构建、数据处理方法及装置有效
申请号: | 201210380761.5 | 申请日: | 2012-10-09 |
公开(公告)号: | CN103714096B | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 秦剑 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 黄熊,王宝筠 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了一种基于Lucene的倒排索引系统构建方法。该方法包括将海量数据记录的倒排索引写入至少一个倒排索引文件;在各倒排索引文件写入完毕后,将写入完毕的倒排文件的描述信息写入与该倒排文件关联的至少一个描述文件;基于倒排索引文件及倒排索引文件的描述文件构建倒排索引系统。本申请实施例还提供了一种基于Lucene的倒排索引系统构建装置,以及基于倒排索引系统的数据处理方法和相应的装置。本申请实施例能够提高倒排索引系统构建效率和数据处理效率。 | ||
搜索关键词: | 基于 lucene 索引 系统 构建 数据处理 方法 装置 | ||
【主权项】:
一种基于Lucene的倒排索引系统构建方法,其特征在于,该方法包括:将海量数据记录的倒排索引写入至少一个倒排文件;在倒排文件写入完毕后,将写入完毕的倒排文件的描述信息写入与该倒排文件关联的至少一个描述文件;所述描述信息为倒排文件的大小、存放的倒排索引条数、文件起始地址信息或文件终止地址信息;基于倒排文件及倒排文件的描述文件,对所述倒排文件和描述文件进行组织,构建倒排索引系统;所述将海量数据记录的倒排索引写入至少一个倒排索引文件具体包括:将海量数据记录划分为多个数据分片,将每个数据分片内的数据记录的倒排索引写入至少一个倒排文件。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210380761.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于研究桩-土相互作用的试验装置
- 下一篇:一种防水构件