[发明专利]非法网页的判断方法和装置在审

申请号：	201810758143.7	申请日：	2018-07-11
公开（公告）号：	CN108959264A	公开（公告）日：	2018-12-07
发明（设计）人：	董金波	申请（专利权）人：	郑州云海信息技术有限公司
主分类号：	G06F17/27	分类号：	G06F17/27;G06F17/30
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	白天明;解婷婷
地址：	450018 河南省郑州市***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了非法网页的判断方法和装置。该方法包括：如果判断网页包括文本内容，则将网页的文本内容拆分成各个完整的句子；调用自然语言理解模型来判断每个句子的句子结构，并且根据判断出的句子的句子结构，将每个句子拆分成多个词语；根据句子结构，确定各个词语的词性，并且为各个词语添加相应的词性标签；根据带有词性标签的词语所对应的非法内容权重，计算网页的文本内容的非法内容分数，作为网页的非法内容分数；根据网页的非法内容分数，判断网页是否是非法网页。根据词语的权重来确定网页是否是非法网页，可以节省了大量的人工成本以及审核网页所需的时间，减小了人工审核时存在的判断错误的可能性或者遗漏非法网页内容的可能性。
搜索关键词：	网页非法网页非法内容句子句子结构文本内容词语词性方法和装置标签自然语言理解词语添加人工成本人工审核减小权重调用遗漏审核
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种非法网页的判断方法，其特征在于，包括：判断网页是否包括文本内容和图像内容；如果所述网页包括文本内容，则将所述网页的文本内容拆分成各个完整的句子；调用自然语言理解模型来判断每个句子的句子结构，并且根据判断出的句子的句子结构，将每个句子拆分成多个词语；根据所述句子结构，确定各个词语的词性，并且为各个所述词语添加相应的词性标签；根据带有所述词性标签的所述词语所对应的非法内容权重，计算所述网页的文本内容的非法内容分数，作为所述网页的非法内容分数；根据所述网页的非法内容分数，判断所述网页是否是非法网页。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司，未经郑州云海信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810758143.7/，转载请声明来源钻瓜专利网。

上一篇：一种词条权重计算模型训练方法及装置
下一篇：跨领域文本情感分类方法、装置、计算机设备及存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]非法网页的判断方法和装置在审

专利文献下载