[发明专利]非法网页的判断方法和装置在审
申请号: | 201810758143.7 | 申请日: | 2018-07-11 |
公开(公告)号: | CN108959264A | 公开(公告)日: | 2018-12-07 |
发明(设计)人: | 董金波 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 白天明;解婷婷 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了非法网页的判断方法和装置。该方法包括:如果判断网页包括文本内容,则将网页的文本内容拆分成各个完整的句子;调用自然语言理解模型来判断每个句子的句子结构,并且根据判断出的句子的句子结构,将每个句子拆分成多个词语;根据句子结构,确定各个词语的词性,并且为各个词语添加相应的词性标签;根据带有词性标签的词语所对应的非法内容权重,计算网页的文本内容的非法内容分数,作为网页的非法内容分数;根据网页的非法内容分数,判断网页是否是非法网页。根据词语的权重来确定网页是否是非法网页,可以节省了大量的人工成本以及审核网页所需的时间,减小了人工审核时存在的判断错误的可能性或者遗漏非法网页内容的可能性。 | ||
搜索关键词: | 网页 非法网页 非法内容 句子 句子结构 文本内容 词语 词性 方法和装置 标签 自然语言理解 词语添加 人工成本 人工审核 减小 权重 调用 遗漏 审核 | ||
【主权项】:
1.一种非法网页的判断方法,其特征在于,包括:判断网页是否包括文本内容和图像内容;如果所述网页包括文本内容,则将所述网页的文本内容拆分成各个完整的句子;调用自然语言理解模型来判断每个句子的句子结构,并且根据判断出的句子的句子结构,将每个句子拆分成多个词语;根据所述句子结构,确定各个词语的词性,并且为各个所述词语添加相应的词性标签;根据带有所述词性标签的所述词语所对应的非法内容权重,计算所述网页的文本内容的非法内容分数,作为所述网页的非法内容分数;根据所述网页的非法内容分数,判断所述网页是否是非法网页。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810758143.7/,转载请声明来源钻瓜专利网。