[发明专利]一种基于自主学习的对等网络流量识别方法有效

申请号：	201310262848.7	申请日：	2013-06-28
公开（公告）号：	CN103312565A	公开（公告）日：	2013-09-18
发明（设计）人：	肖甫;闫海军;王汝传;韩志杰;王少辉	申请（专利权）人：	南京邮电大学
主分类号：	H04L12/26	分类号：	H04L12/26;H04L29/08
代理公司：	江苏爱信律师事务所 32241	代理人：	唐小红
地址：	210003 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于自主学习的对等网络流量识别方法是一种高效的、准确的P2P流量识别方法，其不仅利用了DPI和DFI两种识别方法，而且利用DPI已识别的P2P流量来对基于机器学习的DFI识别结果进行验证,达到自主学习的目的。通过这种方法既可以识别加密的P2P网络流量，同时还克服了DFI无法自调整和识别率低的问题。具体的是提出了一种通过NetFilter技术对P2P流量进行提取，然后利用DPI技术进行识别，并将识别出的P2P流量的特征添加到IP地址列表中，对基于机器学习的DFI识别结果进行验证，使整个识别过程形成一个闭环系统，实现具有自主学习能力的P2P流量识别方法。
搜索关键词：	一种基于自主学习对等网络流量识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于自主学习的对等网络流量识别方法，其特征在于该方法所包含的步骤为：步骤1).当流量经过装有该系统的主机时,根据Linux的Netfilter架构，利用HOOK函数对数据包进行抓取；步骤2).对抓取的数据包进行相应的统计；分析数据包的IP层，判断数据包是TCP报文还是UDP报文，若是UDP报文则根据特征库进行UDP报文的DPI检测,若是P2P报文转到步骤4），否则丢弃；步骤3).对识别出的TCP报文进行端口检测，若其端口号在0‑1023之间，说明其不是P2P报文，直接结束；对于TCP数据包，根据特征库进行TCP报文的DPI检测，若不是P2P报文直接丢弃；步骤4).将已识别出的P2P报文中的相应的五元组即：源IP地址，源端口，目的IP地址，目的端口，和传输层协议号装入到IP信息列表中；步骤5).首先通过非P2P和P2P的样本对基于机器学习的DFI模块进行训练，建立关于会话流的数据包长度规律、连接速率、传输字节量、数据包间的时间间隔等信息的流量模型；步骤6). 将DPI检测未识别出的数据包报文发送给DFI检测模块，进行检测，与流量模型对比，判断是否是P2P流量，若检测结果是P2P协议的数据包，则进行步骤7），否则直接结束检测；步骤7).将DFI识别出的P2P协议报文中的IP与DPI识别出的IP列表进行对照验证；步骤8).若IP列表中含有此IP信息，则验证成功，说明DFI成功检测到进行加密的P2P报文，否则结束检测；步骤9).对于成功检测的加密的P2P流量，提取报文中的流量特征信息：源IP地址，源端口，目的IP地址，目的端口，和传输层协议号，利用该流量特征信息对DFI检测模块再进行一次训练，提高流量模型的精确性。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京邮电大学，未经南京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201310262848.7/，转载请声明来源钻瓜专利网。

上一篇：演奏装置及演奏装置的控制方法
下一篇：一种无机防火建筑保温系统及其施工方法

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于自主学习的对等网络流量识别方法有效

专利文献下载