[发明专利]一种面向军事语料的命名实体标注方法在审
申请号: | 202010102664.4 | 申请日: | 2020-02-19 |
公开(公告)号: | CN111428502A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 黄宇;冯洋 | 申请(专利权)人: | 中科世通亨奇(北京)科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/169;G06N3/04 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 叶宇 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向军事语料的命名实体标注方法,分别使用基于双向LSTM与CRF结合的神经网络模型、基于Lattice LSTM神经网络模型和基于BERT预训练神经网络模型三种深度神经网络来进行机器命名实体识别自动标注;使用XGBoost方法将S1的三种算法获取的结果进行集成学习,获取标注成功的样本和标注失败的样本,其中成功样本的定义是三种机器实体识别中任意两种识别结果一致的样本,失败样本的定义三种机器实体识别结果都不一致的样本;使用人工标注的方式标注失败的样本;将所有样本标注结果以json的方式存入数据库管理。本发明可以显著提高军事语料中军事实体的标注准确率,同时以最小的人工代价达到最好的标注效果。 | ||
搜索关键词: | 一种 面向 军事 语料 命名 实体 标注 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科世通亨奇(北京)科技有限公司,未经中科世通亨奇(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010102664.4/,转载请声明来源钻瓜专利网。