[发明专利]一种文字图像浓淡调整的方法有效
申请号: | 201110361814.4 | 申请日: | 2011-11-15 |
公开(公告)号: | CN103106673A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 胡希驰;李平立;史培培 | 申请(专利权)人: | 北京大学;方正国际软件(北京)有限公司 |
主分类号: | G06T11/00 | 分类号: | G06T11/00 |
代理公司: | 北京天悦专利代理事务所(普通合伙) 11311 | 代理人: | 田明;任晓航 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 图像 浓淡 调整 方法 | ||
技术领域
本发明涉及文字图像处理领域,具体涉及一种文字图像浓淡调整的方法。
背景技术
在文字图像处理时,由于扫描条件的不同,扫描出的文档图像灰度分布也不同。对于实际的版面数字化生产中,不同的OCR(Optical Character Recognition,光学字符识别)引擎对于不同“浓淡”程度的文字图像准确率也不同。有些对于“淡”一些的文字识别率较高,有些对于“浓”一些的文字识别率较高。当灰度图作为输出保存时,则需要将文字调整到人眼阅读舒适的程度。
在图像处理领域已有很多的图像灰度调整技术,如直方图均衡等。但是这些通用的灰度调整技术并非专门针对文字扫描图像所设计的,也无法给出“浓淡”度量。而在生产中还在使用工人利用图像处理软件手工调整的方式,如灰阶、拉曲线等方式。由于每一页都需要调整,对于大规模的图书加工,效率低、成本高,无法满足要求。此外由于对于“浓淡”的判断主观性很强,不同人的认知可能不同,因此,需要利用图像处理技术设计一种自动调整的方法,。
在现有技术中,申请号为CN201010568385.3、名称为“一种调整版面浓淡的方法与系统”的专利申请公开了一种调整版面浓淡的方法与系统。此篇专利中的调整方法利用的是二值图中的黑白像素比例,但是无法得到灰度图,其本质是调整二值图中文字比划的粗细。现有技术存在的问题是仅仅利用二值图黑白像素数量比例,只能输出二值图,反应了笔画的粗细,但无法反映文字灰度的深浅。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种文字图像浓淡调整的方法,通过该方法实现对文字图像的自动处理方法,不仅能够反映笔画的粗细,还能够反映笔画灰度的深浅,同时保持文字边界处的灰阶变化。
为实现上述目的,本发明采用的技术方案如下:
一种文字图像浓淡调整的方法,包括以下步骤:
(1)获得文字图像的灰度直方图以及文字图像的初始黑场值和初始白场值,并对文字图像进行二值化处理得到文字图像的二值图像;
(2)将二值图像进行连通域标记,并计算每个连通域的最小外接矩形和细化骨架区域;
(3)分别计算每个连通域的最小外接矩形区域内所有像素点的黑度和值,和每个连通域的细化骨架区域内所有像素点的黑度和值,并计算每个连通域的最小外接矩形内所有像素点的黑度和值与该连通域的细化骨架区域内所有像素点的黑度和值的比值,记为黑度和值比;其中,黑度和值为所有像素点的黑度值之和,黑度值Dark(x,y)=1-f(x,y),f(x,y)表示像素点坐标为(x,y)的像素值归一化后的像素值;
(4)计算文字图像的浓淡值dense,浓淡值是指所有连通域的黑度和值比的和与连通域的个数的比值;
(5)查看浓淡值dense与设定浓淡值的误差绝对值是否小于设定值,若是则结束对文字图像的调整;若否则调整文字图像的黑场值或/和白场值并返回步骤(2);所述设定浓淡值是用户根据实际文字图像调整需要而设定的文字图像的目标浓淡值。
进一步,如上所述的一种文字图像浓淡调整的方法,步骤(5)中,若调整文字图像的黑场值或/和白场值后,若重新计算浓淡值dense的次数达到设定的计算次数的边界条件,则结束对文字图像的调整。
进一步,如上所述的一种文字图像浓淡调整的方法,步骤(5)中,所述设定值的范围为0.001~0.01。
进一步,如上所述的一种文字图像浓淡调整的方法,所述设定值的优选值为0.001。
进一步,如上所述的一种文字图像浓淡调整的方法,在对文字图像的浓淡进行调整前,将文字图像的像素值归一化到[0,1]。
进一步,如上所述的一种文字图像浓淡调整的方法,步骤(2)中,计算每个连通域的最小外接矩形后,还包括对所述连通域进行合并,合并的具体方式如下:
确定文字语言种类,若是中文为主,则合并连通域最小外接矩形处于相交、包含位置关系的连通域;若是英文为主,则合并连通域最小外接矩形之间间隙小于设定值的相邻连通域。
进一步,如上所述的一种文字图像浓淡调整的方法,步骤(2)中,对连通域进行合并后,还包括对连通域的筛选,筛选的具体方式如下:
确定文字语言种类,若是中文为主,则筛选M个合并后最小外接矩形为正方形的合并连通域;若是英文为主,则筛选N个合并后满足设定的字符长度的合并连通域,其中,10≤M≤40,10≤N≤40。
再进一步,如上所述的一种文字图像浓淡调整的方法,所述设定的字符长度为4~12个字符长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;方正国际软件(北京)有限公司,未经北京大学;方正国际软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110361814.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序