[发明专利]一种基于深度自学习的垃圾短信过滤方法及系统有效
申请号: | 201610584485.2 | 申请日: | 2016-07-21 |
公开(公告)号: | CN106161209B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 杨卫国;习洋洋;何震宇 | 申请(专利权)人: | 康佳集团股份有限公司 |
主分类号: | H04L12/58 | 分类号: | H04L12/58;H04L29/06;H04W4/14 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518053 广东省深圳市南山区高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度自学习的垃圾短信过滤方法及系统,方法包括:获取若干条样本短信,将短信内容进行预处理后生成对应的样本向量,对样本向量进行编码;移动终端获取编码后的样本向量通过深度自学习编码器网络进行训练并测试,根据测试结果在样本向量中提取垃圾短信的特征;移动终端对接收到的短信进行检测,若检测到存在垃圾短信的特征,则判定收到的短信为垃圾短信并进行过滤掉垃圾短信。本发明通过大量训练短信样本后,能够从内容里抽取出有利于分类的特征,当学习阶段结束后,可以利用该特征对短信进行有效的过滤,通过不断的短信样本训练方式,提高了垃圾短信过滤效率。 | ||
搜索关键词: | 一种 基于 深度 自学习 垃圾 短信 过滤 方法 系统 | ||
【主权项】:
1.一种基于深度自学习的垃圾短信过滤方法,其特征在于,所述方法包括:A、获取若干条样本短信,将短信内容进行预处理后生成对应的样本向量,对样本向量进行编码;B、移动终端获取编码后的样本向量通过深度自学习编码器网络进行训练并测试,根据测试结果在样本向量中提取垃圾短信的特征,其中,通过使用分类目标函数对逐层已训练好的参数进行统一调整训练,使得整个网络适用于对短信内容的分类,并对每一个短信都进行特征向量来描述,并将数据集通过留一法分成互不交叉的训练集和测试集;C、移动终端对接收到的短信进行检测,若检测到存在垃圾短信的特征,则判定收到的短信为垃圾短信并进行过滤掉垃圾短信;其中,所述分类目标函数如下所示:
其中,θ表示模型参数,1{z}表示当z为真时,其值为1,z表示y(i)=j,m表示样本个数,k表示类别个数,y(i)表示第i个样本的类别,x(i)表示第i个样本的个数,T为矩阵转置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康佳集团股份有限公司,未经康佳集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610584485.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种利用多光谱相机虚拟响应值获取光谱反射比的方法
- 下一篇:一种散热器