[发明专利]OCR字符识别方法及系统有效
申请号: | 201310752624.4 | 申请日: | 2013-12-31 |
公开(公告)号: | CN103679165A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 王海峰;和为 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种OCR字符识别方法,包括:对用户选择的目标区域内的图像进行OCR字符识别以得到识别的词串;计算识别的词串中子词串的数量;如果词串中子词串的数量大于2,则判断第1个子词串W1中字符的个数和第K个子词串WK中字符的个数是否小于预设值;如果W1中字符的个数和/或WK中字符的个数小于预设值,则判断W1的噪声概率得分和/或WK的噪声概率得分是否大于预设噪音;如果是,则判定W1和/或WK为噪声并从词串中删除W1和/或WK以得到新的词串。根据本发明的实施例可提升对OCR识别的结果的OCR翻译的准确性。本发明还提出了一种OCR字符识别系统。 | ||
搜索关键词: | ocr 字符 识别 方法 系统 | ||
【主权项】:
一种OCR字符识别方法,其特征在于,包括以下步骤:对用户选择的目标区域内的图像进行OCR字符识别以得到识别的词串,其中,所述词串包括K个子词串,每个子词串至少包括1个字符,所述K为正整数;计算所述识别的词串中子词串的数量;如果所述词串中子词串的数量大于2,则判断所述第1个子词串W1中字符的个数和所述第K个子词串WK中字符的个数是否小于预设值;如果所述W1中字符的个数和/或WK中字符的个数小于所述预设值,则判断所述W1的噪声概率得分和/或WK的噪声概率得分是否大于预设噪音;如果是,则判定所述W1和/或所述WK为噪声并从所述词串中删除所述W1和/或所述WK以得到新的词串。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310752624.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种管道产品的管帽
- 下一篇:带有辅助加热装置的废烟支处理系统