[发明专利]一种无冗余情节规则的抽取方法无效
申请号: | 201310244601.2 | 申请日: | 2013-06-19 |
公开(公告)号: | CN103324712A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 尤涛;杜承烈;徐伟;赵湑 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种无冗余情节规则的抽取方法,根据最小发生的概念获得的频繁闭情节的置信区间描述更为精确,针对尚未确定为生成子的频繁闭情节,比较闭情节与其真子情节的支持度确定其真子情节是否为非可导生成子,避免了冗余的情节生成子判断,直接由频繁闭情节及其生成子产生无冗余情节规则,提高了情节规则的生成质量和生成效率。 | ||
搜索关键词: | 一种 冗余 情节 规则 抽取 方法 | ||
【主权项】:
1.一种无冗余情节规则的抽取方法,其特征在于步骤如下:步骤1:由若干事件按发生时间先后排序的序列定义数据流上的事件序列
其中ti<tj(1≤i≤j≤s),扫描事件序列ES,生成事件序列的纵向表达方式,给定最小支持度min_sup和最小可信度;步骤2:若情节α的支持度大于等于min_sup,则α是一个频繁情节,对于事件序列ES,找出所有的频繁情节;所述min_sup为支持度阈值;步骤3:对于滑动窗口中的数据,若情节α是频繁的,且α的任何一个真超情节的支持度均不等于α的支持度,则α是一个频繁闭情节,使用闭情节挖掘算法Apriori算法进行单遍挖掘,得到支持度大于阈值的闭情节,将结果保存于一棵全局频繁闭情节树中;步骤4:对于频繁闭情节α,对于每个
的界限ulx(α);当|α/x|是奇数的时候,ulx(α)为α.sup的上限,表示为ux(α),ux(α)的最小值成为α.sup的最小上限,表示为mu(α);当|α/x|是偶数的时候,ulx(α)为α.sup的下限,表示为lx(α),lx(α)的最大值称为α.sup的最大下限,表示为ml(α)。如果α.sup=ml(α)=mu(α),称α为可导集,反之,称α为非可导集。根据给定一个情节,如果它的一个真子情节和它的支持度一致,则该情节及其为前缀的其它任何情节都是可导情节的性质,可以快速挖掘闭情节非可导生成子;步骤5:设
j是情节β在情节α中首次出现的结束为止,则从α中删除第1至第j个事件类型后剩余的情节称为β在α上的投影,记为project(α,β);给定情节α=<E1E2…Em>和β=<E1'E2'…Ek'>,则<E1E2…EmE1'E2'…Ek'>称α和β的串接,记为
对于给定的闭情节以及其非可导生成子,求出非可导生成子在闭情节上的投影,对于非可导生成子以及其在闭情节上的投影,求出非可导生成子和在闭情节上的投影的串接;步骤6:比较频繁闭情节及其非可导生成子的支持度比值,如果比值大于最小可信度,则将频繁闭情节及其非可导生成子生成的情节规则加入到情节规则集合中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310244601.2/,转载请声明来源钻瓜专利网。