[发明专利]基于自动机的藏文拼写检查方法和装置有效
申请号: | 201610409221.3 | 申请日: | 2016-06-13 |
公开(公告)号: | CN106095756B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 尼玛扎西 | 申请(专利权)人: | 尼玛扎西 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 850000 西藏*** | 国省代码: | 西藏;54 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自动机的藏文拼写检查方法和装置,涉及自然语言处理领域。为解决现有技术由于适应面较狭窄,导致无法识别一些特殊结构的藏文字的问题而发明。本发明实施例提供的技术方案包括:S10、将待检查藏文文本以字为单位进行切分,得到至少一个藏文字;S20、将所述至少一个藏文字作为预设有限状态自动机群组的输入;S30、通过所述有限状态自动机群组判断所述待检查藏文文本是否拼写正确。 | ||
搜索关键词: | 基于 自动机 藏文 拼写 检查 方法 装置 | ||
【主权项】:
1.一种基于自动机的藏文拼写检查方法,其特征在于,包括:S10、将待检查藏文文本以字为单位进行切分,得到至少一个藏文字;S20、将所述至少一个藏文字作为预设有限状态自动机群组的输入;S30、通过所述有限状态自动机群组判断所述待检查藏文文本是否拼写正确;所述有限状态自动机群组包括37个有限状态自动机,其中任一有限状态自动机Mi=(Σi,Qi,δi,qi,Fi);所述Σi为预设藏文拼写形式文法Gi的终结符的有限集合;所述Qi为所述藏文拼写形式文法Gi的非终结符的有限集合Vi与所述Fi的并集;所述δi是根据Qi与Σi之直积Qi×Σi到Qi的映射获取的所述有限状态自动机Mi的状态转移函数;所述qi为所述有限状态自动机Mi的初始状态,所述qi∈Qi;所述Fi为所述有限状态自动机Mi的终止状态的有限集合,所述Fi⊆Qi;所述i为正整数,所述i≤37;在所述S20之前,还包括:S11、获取所述藏文拼写形式文法Gi,所述Gi=(Σi,Vi,Si,Pi);S12、获取所述有限状态自动机Mi的终止状态标识Ei;S13、判断所述藏文拼写形式文法Gi的产生式规则的有限集合Pi中是否包含产生式规则Si→λ;S14、如果是,获取值为Si和Ei的Fi;S15、如果不是,获取值为Ei的Fi;S16、根据所述Σi、Vi、Si、Fi,获取所述有限状态自动机Mi;所述Si为所述藏文拼写形式文法Gi的起始符,所述Si∈Vi;所述λ为空字符;所述有限状态自动机Mi的初始状态qi与所述藏文拼写形式文法Gi的起始符Si等价;所述Vi为非终结符的有限集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尼玛扎西,未经尼玛扎西许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610409221.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种改良型醋酸白用于快速筛查宫颈癌一体式装置
- 下一篇:一种可拆卸的水槽架