[发明专利]一种基于单词查找树实现的汉语拼音快速分词方法有效
申请号: | 201210332072.7 | 申请日: | 2012-09-10 |
公开(公告)号: | CN102867049A | 公开(公告)日: | 2013-01-09 |
发明(设计)人: | 于少飞;袁美英;杨震威 | 申请(专利权)人: | 山东康威通信技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250101 山东省济南市高新技*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于单词查找树实现的汉语拼音快速分词方法,该方法通过计算机或者嵌入式可移动设备来实现,主要工作步骤如下:步骤一、根据所有已知的汉语单字拼音表建立汉语单字拼音查找树;步骤二、依据已建立的单词查找树,将查找树与哈希表结合,对给定的一串汉语拼音进行分词;步骤三、给出分词结果;步骤四、销毁查找树,释放资源。本发明利用字符串的公共前缀来节约构造空间,最大限度地减少无谓的字符串比较;利用带索引的冗余哈希表来提高查询效率,最大限度减小算法的时间复杂度。 | ||
搜索关键词: | 一种 基于 单词 查找 实现 汉语拼音 快速 分词 方法 | ||
【主权项】:
一种基于单词查找树实现的汉语拼音快速分词方法,该方法通过计算机或者嵌入式可移动设备来实现,其特征是,主要工作步骤如下:步骤一、根据所有已知的汉语单字拼音表建立汉语单字拼音查找树;步骤二、依据已建立的单词查找树,将查找树与哈希表结合,对给定的一串汉语拼音进行分词;步骤三、给出分词结果;步骤四、销毁查找树,释放资源。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东康威通信技术股份有限公司,未经山东康威通信技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210332072.7/,转载请声明来源钻瓜专利网。