[发明专利]一种面向HDFS的网络报文并行读取方法在审
申请号: | 201610353612.8 | 申请日: | 2016-05-25 |
公开(公告)号: | CN106027414A | 公开(公告)日: | 2016-10-12 |
发明(设计)人: | 吴骏;刘勇;汤兆亮;高扬;吴和生;李宁 | 申请(专利权)人: | 南京大学 |
主分类号: | H04L12/861 | 分类号: | H04L12/861;H04L29/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种面向HDFS的网络报文并行读取方法,包括网络数据捕获与pcap报文解析两个阶段。本方法依托Hadoop平台的分布式框架MapReduce与分布式文件系统HDFS,将捕获的网络数据包写入HDFS,并通过本发明实现的二进制pcap流解析方法将pcap报文并行的解析出来,形成key‑value对然后交由MapReduce框架进行分析处理。通过本发明中的方法大大提高了HDFS下pcap格式文件的并行读取能力,进而提高了后续网络数据包的并行分析与处理效率。 | ||
搜索关键词: | 一种 面向 hdfs 网络 报文 并行 读取 方法 | ||
【主权项】:
一种面向HDFS的网络报文并行读取方法,其特征在于,包括网络数据捕获与pcap报文解析两个阶段,具体包括下列步骤:1)网络数据捕获阶段1a)pcap报文采集器从交换机或路由设备实时捕获网络数据包;1b)通过HDFS流写入模块将数据包以二进制pcap格式写入HDFS;1c)分割容量V大于HDFS默认64MB的文件,使大文件以V/64MB或者V/64MB+1个block存储于分布式文件系统当中;2)pcap报文解析阶段:2a)通过给定规则探测出每个block中首个pcap报文的起始偏移量;2b)跳过起始位置之前的所有字节;2c)依次解析block中所有的pcap报文;2d)将每次解析的pcap报文结果输入Map操作;2e)结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610353612.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种多功能的讲台
- 下一篇:1;3-二甲基金刚烷的制备方法