[发明专利]基于网络挖掘的遥感产品检索限定项语义扩展方法有效
申请号: | 201610048113.8 | 申请日: | 2016-01-15 |
公开(公告)号: | CN105786964B | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 何建军;李玉堂;陈婷;关盛勇;王西亚;高宇;武文斌;高松峰 | 申请(专利权)人: | 二十一世纪空间技术应用股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/338 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 王雪芬 |
地址: | 100096 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于网络挖掘的遥感产品检索限定项语义扩展方法,主要包括:基于网络搜索结果的简介内容、时间信息抽取,形成摘录篇章;抽取、摘录篇章中的时间词、空间词,标注时间词对应的基本时间表达和空间词;将已标注的基本时间表达进行规范化处理;统计规范化的基本时间表达和空间词,将高频出现的时空词作为扩展结果。针对遥感产品检索中,用户输入的时空信息具有模糊性、指代性、动态性的问题,提出基于网络挖掘的遥感产品检索限定项语义扩展方法,定位完整的时空信息,实现对用户输入信息的语义扩展,进而准确理解用户需求,提高检索的准确性、实时性。 | ||
搜索关键词: | 基于 网络 挖掘 遥感 产品 检索 限定 语义 扩展 方法 | ||
【主权项】:
1.一种基于网络挖掘的遥感产品检索限定项语义扩展方法,包括如下步骤:S1、将查询内容的限定项输入搜索引擎,对网络搜索结果进行抽取,抽取每条记录的内容简介形成语段,顺序组成摘录篇章;同时,抽取每条记录的公开时间,在无公开时间的情况下抽取文档建立时间,定义时间规范格式,将公开时间或文档建立时间按照时间规范格式转换作为基准参照时间,并将基准参照时间记录在其对应的内容简介语段中;若某条记录无公开时间和文档建立时间,或者公开时间、文档建立时间不能按照时间规范格式转换,则其对应的内容简介语段无基准参照时间;S2、对摘录篇章进行分词处理,识别分词中时间词和空间词,将时间词形成基本时间表达,并标注基本时间表达、空间词;S3、对没有基准参照时间的语段,判定已标注的基本时间表达中是否有与时间规范格式匹配的基本时间表达,若有,将其设为该语段的基准参照时间;若没有,删除该语段;对含有基准参照时间的语段,将已标注的基本时间表达转换为时间规范格式,若转换时基本时间表达不完整,则缺失部分填充该语段的基准参照时间;S4、统计规范的时间表达和空间词,将最高频出现的时间表达和空间词作为语义扩展结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于二十一世纪空间技术应用股份有限公司,未经二十一世纪空间技术应用股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610048113.8/,转载请声明来源钻瓜专利网。