[发明专利]一种基于遗传算法和改进兴趣度的智慧零售数据挖掘方法在审
申请号: | 201710673608.4 | 申请日: | 2017-08-09 |
公开(公告)号: | CN107491988A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 肖亮;石佳文;汪澍;袁霄 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30;G06N3/12 |
代理公司: | 杭州天正专利事务所有限公司33201 | 代理人: | 王兵,黄美娟 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于遗传算法和改进兴趣度的智慧零售数据挖掘方法,适用于在客户关系管理(CRM)领域,使用关联规则技术分析顾客的购买行为。本发明利用门店已有的大量顾客消费数据,使用遗传算法筛选出满足支持度要求的频繁项集,再由这些频繁项集生成用户感兴趣的关联规则。由于遗传算法负责找出频繁项集,所以引入适应度函数fit将出现频率低的项集删掉;而兴趣度则用来确保规则有趣,即通过频繁项集生成关联规则的时候不仅要满足最小置信度的要求还要满足兴趣度的要求,这样就保证了挖掘出来的规则是用户感兴趣的关联规则。加入遗传算法和兴趣度模型来对客户潜在需求进行挖掘,使得到的商品之间的关联性可靠,客户潜在的购物机会明确。 | ||
搜索关键词: | 一种 基于 遗传 算法 改进 兴趣 智慧 零售 数据 挖掘 方法 | ||
【主权项】:
一种基于遗传算法和改进兴趣度的智慧零售数据挖掘方法,包括以下步骤:1)从商店顾客的消费记录数据库中读取购物信息,确定项集:I={I1,I2,I3......In},项集内包含各类商品,n=k是k项集如I={I1,I2,I3......In},表示各类商品的组成的集合;2)事务数据库T={t1,t2,t3......tn},其中事务数据库中的每一项都包含项集I中的一项或者若干项,事务数据库中包含每一条购物的消费记录,每一个事务都用一个TID进行表示;3)定义项集X支持度,用sup(X)表示,sup(X)等于包含X项集的事务数除以事务数据库中总的事务数,即sup(X)=Count(x)||T||*100%---(1)]]>其中Count(x)表示包含X项集的事务数;T事务数据库中总的事务数,即购物记录数;4)定义置信度,若顾客购买商品X和购买商品Y同时发生记为C,则关联规则X→Y的置信度为C的支持度的值除以购买商品X的支持度的值,用conf表示置信度,则conf(X→Y)=sup(C)sup(X)=sup(X∪Y)sup(X)---(2)]]>即关联规则X→Y的置信度是商品X和商品Y同时出现的事务数跟只出现商品X的事务数的比值,体现了购买商品Y对购买商品X的依赖程度,即在购买商品X发生的情况下再购买商品Y的概率;5)引入兴趣度函数来去除不合理的商品关联,兴趣度模型如下:Interest(A→B)=LIFT(A,B)-1LIFT(A,B)+1---(3)]]>其中LIFT(A,B)表示提升度,6)初始化参数:定义种群大小为m,交叉概率Pc,变异概率Pm,迭代终止代数T,最小支持度minsup,最小支持度minconf,最小兴趣度mininterest;7)初始化种群P={Pc1,Pc2,…Pcm},每个个体根据编码规则生成;8)计算每个个体的适应度函数,Fit(Ri)=count(R)m*1minsup-1---(4)]]>将Fit(Ri)≥0个体选择进入下一代,否则淘汰掉;9)补充种群的个体:统计上一步操作之后被选入下一代的个体数量n,若n<m则对上一代适应度函数从高到低进行排序,选中m‐n个;10)适应度值较高的个体复制到下一代中,直到种群大小变为n=m;11)初始化交配池,令交配池C=φi;12)找出群体中相同属性的个体并把它们归为一类,定义该类为第i(i=l,2,...,n)类,个体浓度为个体的浓度概率为显然然后定义个体的选择概率为Q,Q由适应度概率Qf,和浓度概率Qi决定:Q=αQf+(1‑α)Qi,其中是常数;13)交叉操作:采用自适应方法随机动态调节交叉概率,使得交叉概率Qc能够随适应度自动改变.当种群中个体的适应度趋于一致或者趋于局部最优时,使Qc增加,而当群体适应度比较分散时,使Qc减小,其中交叉概率Qc={Qc1-(Qc1-rand(Qc2))(f′-favg)fmax-favg,f′≥favgQc1,f′<favg---(5)]]>式中:Qc1=0.9;0.6≤Qc2<0.9;f’为要交叉的2个个体中较大的适应度值,fmax是最大适应度值;favg是平均适应度值;14)变异操作,采用自适应方法随机动态调节变异概率,使得变异概率Qm,能够随适应度自动改变,当种群中个体的适应度趋于一致或者趋于局部最优时,使Qm增加,而当群体适应度比较分散时,使Qm减小,其中变异概率Qm={Qm1-(Qm1-rand(Qm2))(f′-favg)fmax-favg,f′≥favgQm1,f′<favg---(6)]]>式中:Qm1=0.1;0.001≤Qm2<0.1;f为要变异个体的适应度值;15)判断终止条件,看是否满足终止条件,若满足则终止并输出关联规则,判断生成规则是否满足置信度:其中兴趣度模型interest(Ri)为:否则转到第3)步;16)输出满足最小支持度minsup,最小置信度minconf和最小兴趣度的关联规则。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710673608.4/,转载请声明来源钻瓜专利网。