[发明专利]动态确认样本相似的方法及装置有效
申请号: | 201210375906.2 | 申请日: | 2012-09-29 |
公开(公告)号: | CN103714049A | 公开(公告)日: | 2014-04-09 |
发明(设计)人: | 张国先 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种动态确认样本相似的方法,包括以下步骤:分别获得多个样本;根据多个样本的内容获得总样本额度;根据总样本额度以及预设规则确定相似度浮动阈值,其中,总样本额度与相似度浮动阈值成反比;获得多个样本之间的真实相似度;如果多个样本之间的真实相似度大于相似度浮动阈值,则判断多个样本之间相似。该方法可应用在社区网站防止重复灌水、内容网站相似用户的内容推荐、学术剽窃等领域,可有效减少命中的失败率。本发明提出的动态确认样本相似的方法适用于实时性要求高的场合,效率高。本发明还公开一种动态确认样本相似的装置。 | ||
搜索关键词: | 动态 确认 样本 相似 方法 装置 | ||
【主权项】:
一种动态确认样本相似的方法,其特征在于,包括以下步骤:分别获得多个样本;根据所述多个样本的内容获得所述总样本额度;根据所述总样本额度以及预设规则确定相似度浮动阈值,其中,所述总样本额度与所述相似度浮动阈值成反比;获取所述多个样本之间的真实相似度;以及如果所述多个样本之间的真实相似度大于所述相似度浮动阈值,则判断所述多个样本之间相似。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210375906.2/,转载请声明来源钻瓜专利网。