[发明专利]一种基于神经网络的推荐方法有效
申请号: | 201811215216.4 | 申请日: | 2018-10-18 |
公开(公告)号: | CN109447698B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 周曦;张竹昕 | 申请(专利权)人: | 广州云从人工智能技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 尹丽云 |
地址: | 511457 广东省广州市南沙区丰泽*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于神经网络的推荐方法,采用以下步骤,S1:从底层模块中提取结构化数据,将结构化数据添加到数据集中,将数据集中用户信息输入到用户处理模块,将数据集中商业信息输入到广告处理模块;S2:对数据集中的特征进行清洗,对于数据集中含有的缺失值,可以根据缺失的具体的类型使用均值填充、众数填充、随机森林填充、猜测矩阵填充方式,将缺失值补齐;对于缺失比例超过30%的特征予以剔除,用箱型图和统计学异常值判断的方法剔除异常值并填补正常值。针对某大数据应用场景,多级异构深度大数据神经网络的第一级神经网络,在AI建模完成后,对大数据进行多维度融合和挖掘,其输出结果代表了神经网络对该应用场景的判断。 | ||
搜索关键词: | 一种 基于 神经网络 推荐 方法 | ||
【主权项】:
1.一种基于神经网络的推荐算法,其特征在于:采用以下步骤,S1:从底层模块中提取结构化数据,将结构化数据添加到数据集中,将数据集中用户信息输入到用户处理模块,将数据集中商业信息输入到广告处理模块;S2:对数据集中的特征进行清洗,对于数据集中含有的缺失值,可以根据缺失的具体的类型使用均值填充、众数填充、随机森林填充、猜测矩阵填充方式,将缺失值补齐;对于缺失比例超过30%的特征予以剔除,用箱型图和统计学异常值判断的方法剔除异常值并填补正常值;S3:对特征进行判断,如果特征是连续型的称之为密集特征,则按照步骤S4处理,如果特征是离散型的,则按照步骤S5处理;S4:直接归一化后放入神经网络或者用分箱操作将特征进行分类,转化为离散型特征;S5:采用独热编码的方式使这些特征变成稀疏特征,利用神经网络进行特征重组,使特征维度增加;S6:采用训练集训练神经网络模型,根据用户曾经消费最多的商户给训练数据的用户打标签,作为训练集的目标集;训练集为用户和商户的各项特征,目标集为用户和商户的标签;设置神经网络的参数,将重组后的特征作为输入,输入设置好维度的神经网络张量中,得到用户和用户标签的匹配;S7:采用混淆矩阵对训练完成的神经网络模型进行评估,计算每个标签的精准度和召回率,并且得到AUC值,判断神经网络模型是否能准确评估客户和商户的标签;S8:对特征向量提取,最后的特征处理成为一个embedding层,embeding层定义为从一个矩阵中选择一行,一行对应着一个离散的新的特征,将两个神经网络模型的低维向量提取之后,进行存储;S9:对点乘进行评估,将用户处理模块对应的输出向量和广告处理模块对应的输出向量两两点乘,得到其在向量空间中的大小,点乘的最终向量大小与客户和广告的匹配度为正相关;S10:针对每一个客户,对应生产一个由点乘向量组成的目标向量集合,对目标向量集合内的点乘向量按从大到小进行排序,按照从大到小的顺序选取前x个点乘向量给用户做推荐,x为正整数,且x>1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州云从人工智能技术有限公司,未经广州云从人工智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811215216.4/,转载请声明来源钻瓜专利网。
- 上一篇:房地产价格评估方法和房地产价格评估系统
- 下一篇:一种专利价值评估系统