[发明专利]书法字识别方法无效
申请号: | 201310020510.0 | 申请日: | 2013-01-18 |
公开(公告)号: | CN103093240A | 公开(公告)日: | 2013-05-08 |
发明(设计)人: | 庄越挺;吴江琴;林媛;高鹏程;夏洋 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 张法高 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种书法字识别的方法。搜集单个书法字图像,人工标注单个书法字图像对应的汉字语义,对单个书法字图像进行二值化、去噪和归一化处理后提取单个书法字图像中书法字的特征信息,存入特征数据库,特征信息包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、投影值、轮廓点,之后对待识别的单个书法字图像也进行处理,提取待识别书法字的特征信息,初步筛选后,再进行形状匹配比较,筛选出特征数据库里与待识别书法字形状相似的书法字,最后进行权重计算、合并汉字语义相同书法字图像,给出识别结果。本发明计算量小,能够在较短时间内给准确的识别结果;对用户所提供的待识别书法字图像没有具体要求。 | ||
搜索关键词: | 书法 识别 方法 | ||
【主权项】:
一种书法字识别方法,其特征在于,包括以下步骤:1)搜集互联网上的单个书法字图像,或者从整个书法作品图像里对书法字做最小包围盒切分得到单个书法字图像,得到单个书法字图像集合,然后标注单个书法字图像对应的汉字语义,存入特征数据库;2)对单个书法字图像进行二值化、去噪、归一化处理,二值化时,先将单个书法字图像转为灰度图像后使用自适应迭代法,通过将新阈值置为旧阈值以上及以下两区平均值的中点不断迭代求取最佳阈值,二值化后的单个书法字图像为白底黑字的二值化颜色矩阵,微小区域的噪声使用数学形态学的方法去除,微小区域的斑点和划痕使用开运算去除,字体中的小孔洞使用闭运算填充,所述的归一化采用基于笔画穿越数均衡的非线性归一化方法,单个书法字图像归一化的目标大小是45×45像素点阵;3)将步骤2)处理后的单个书法字图像对应的书法字四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点存入步骤1)的特征数据库,得到书法字识别特征数据库;4)将待识别书法字图像按照步骤2)进行二值化、去噪、归一化处理,然后提取包括单个书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值、书法字轮廓点的特征;5)利用待识别书法字图像中书法字的四个边界点位置、书法字水平和垂直方向平均笔画穿越数、书法字的投影值这三个特征比较书法字识别特征数据库里的数据,对书法字识别特征数据库里的单个书法字图像进行初步筛选,得到候选书法字图像;6)对候选书法字图像再利用书法字识别特征数据库里的书法字轮廓点的特征信息进一步进行相似度计算,按相似度大小排列给出候选书法字图像;7)对步骤6)中按相似度大小排列给出的候选书法字图像进行权重计算,合并汉字语义相同的候选书法字图像,最后识别输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310020510.0/,转载请声明来源钻瓜专利网。
- 上一篇:矿井巷道LED灯
- 下一篇:人脸检测芯片及人脸检测设备