[发明专利]用于生成图文结构化信息的方法和装置在审
申请号: | 201911296540.8 | 申请日: | 2019-12-16 |
公开(公告)号: | CN111046096A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 田英爱;王长胜;李宁;施运梅;李海波;陈亚军 | 申请(专利权)人: | 北京信息科技大学;王长胜 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F40/189 |
代理公司: | 北京卫智畅科专利代理事务所(普通合伙) 11557 | 代理人: | 陈佳 |
地址: | 100085 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开的实施例公开了用于生成图文结构化信息的方法和装置。该方法的一具体实施方式包括:对待处理的图文混排的版式文档的段落进行识别,得到段落信息,其中,上述段落信息包括用于表征上述段落所在范围的段落外接边框信息;根据上述段落外接边框信息,确定上述段落内的版式图文要素信息;对上述版式图文要素信息进行图元类别信息读取、判定并标记,得到版式图文信息;根据预设的上述版式图文信息的阅读顺序,进行分析、拆分、重排图元对象,得到图文信息;将上述图文信息映射成图文结构化信息。该实施方式实现了图文结构化信息准确生成,进而增强了文档在不同设备上显示的自适应性。 | ||
搜索关键词: | 用于 生成 图文 结构 信息 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学;王长胜,未经北京信息科技大学;王长胜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911296540.8/,转载请声明来源钻瓜专利网。