[发明专利]一种纸质水文年鉴数字化方法有效
申请号: | 201610232680.9 | 申请日: | 2016-04-14 |
公开(公告)号: | CN105938547B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 李士进;陈婉婉;郑展;郝立;蒋亚平;高祥涛;胡金龙 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 田凌涛 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种纸质水文年鉴数字化方法,在单一特征的基础上提出了互补性较强的特征融合方法,识别率得到了提高,水文过程由于受相似的季节性气候因素,以及其他随机因素影响而呈现相似性,也即其流量具有上下文相关性,所以本发明鉴于此相关性,同时提出了基于时间序列的后期纠错机制。即在分类器识别后,根据某种准则对其进行纠错处理,通过实验证明,本发明所提出的机制,有效提高了识别精度,保证了工作效率。 | ||
搜索关键词: | 一种 纸质 水文 年鉴 数字化 方法 | ||
【主权项】:
1.一种纸质水文年鉴数字化方法,其特征在于,包括如下步骤:步骤001.根据纸质水文年鉴页面的版面设计,确定水文资料表格位于纸质水文年鉴页面中的像素位置,然后进入步骤002;步骤002.根据纸质水文年鉴页面中水文资料表格的像素位置,针对水文资料表格分别进行纵向和横向投影,并针对水文资料表格的纵向投影图、横向投影分别进行分析,分别提取水文资料表格中各条竖线的横坐标、各条横线的纵坐标,然后进入步骤003;步骤003.根据水文资料表格的版式,以及水文资料表格中各条竖线的横坐标、各条横线的纵坐标,针对水文资料表格的投影图像,分别获得水文资料表格各个数值单元格中的数据图像,然后进入步骤004;其中,水文资料表格各个数据图像中的数值字符为白色,底色为黑色;步骤004.分别针对各个数据图像,针对数据图像中的各个数值字符进行字符切分,获得该数据图像中的各个数值字符块,进而分别获得各个数据图像中的各个数值字符块,然后进入步骤005;步骤005.分别针对各个数据图像中的各个数值字符块,提取数值字符块中数值字符的网格特征、傅里叶特征、轮廓矩特征,共同作为该数值字符的识别特征,进而分别获得各个数据图像中各个数值字符块中数值字符的识别特征,然后进入步骤006;步骤006.分别针对各个数据图像中的各个数值字符块,判断是否存在由数值字符块顶边向下存在预设数量的黑色像素点,是则判定该数值字符块中为小数点,否则不做任何进一步操作;在完成分别针对各个数据图像中各个数值字符块的判断后,然后进入步骤007;步骤007.针对所有数据图像中数值字符的所有识别特征,进行特征融合,构成水文资料表格中分别对应“0”到“9”的数值识别特征,然后进入步骤008;步骤008.根据水文资料表格中分别对应“0”到“9”的数值识别特征,以及各个数据图像中各个数值字符块中数值字符的识别特征,通过预设分类器,分别获得各个数据图像中各个数值字符块所对应的数字,然后进入步骤009;步骤009.根据各个数据图像中各个数值字符块所对应的数字或小数点,分别构成水文资料表格各个数值单元格中数据图像所对应的数值,再结合水文资料表格版式的各项属性,获得水文资料表格中各项属性,及其所对应的数值,并进行存储,然后进入步骤010;步骤010.针对所识别存储水文资料表格中各项属性、及其所对应的数值,分别针对各个月的流量数值,按如下步骤010‑01至步骤010‑02进行执行,进而分别获得针对各个月每日流量数值的初步识别判断,然后进入步骤011;步骤010‑01.将当月第一日流量数值作为第一阈值,然后分别针对当月前两日流量数值,判断下一日流量数值与当日流量数值之间的差值是否小于第一阈值,是则判断当日流量数值识别无误;否则判断当日流量数值初步识别错误;由此获得分别针对当月前两日流量数值的初步识别判断,然后进入步骤010‑02;步骤010‑02.分别针对当月由第三日开始的各日流量数值,判断下一日流量数值与当日流量数值之间的差值是否小于前一日流量数值,是则判断当日流量数值识别无误;否则判断当日流量数值初步识别错误;由此获得分别针对当月由第三日开始各日流量数值的初步识别判断;步骤011.根据所识别存储水文资料表格中的各个数值,以及各个数值中各个数字的识别特征,通过预设训练器,获得所识别存储水文资料表格中各个数值中的各个数字,分别对应“0”到“9”的十个识别结果概率,然后进入步骤012;步骤012.分别针对所识别存储水文资料表格中各个数值中的各个数字,获得数字所对应“0”到“9”十个识别结果概率中的最大识别结果概率,以及第二大识别结果概率,并获得该最大识别结果概率与该第二大识别结果概率的差值,判断该差值是否小于预设识别结果概率阈值,是则判断该数字初步识别错误;否则判断该数字识别无误;由此获得分别针对所识别存储水文资料表格中各个数值中各个数字的初步识别判断,然后进入步骤013;步骤013.分别针对各月中各个初步识别错误的流量数值,判断初步识别错误的流量数值中是否存在初步识别错误的数字,是则判断该初步识别错误的流量数值错误,并进行报警;否则判断该初步识别错误流量数值无误;由此实现针对所识别存储水文资料表格中各个数值的检验。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610232680.9/,转载请声明来源钻瓜专利网。