[发明专利]一种基于属性相关的差分隐私保护方法有效
申请号: | 201810589946.4 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108776763B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 董宇欣;陈福坤;褚慈;谢晓东;印桂生;韩启龙;王红滨;万丽;秦帅;白云鹏 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张换男 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于属性相关的差分隐私保护方法,属于信息安全技术领域。本发明采取投影转换的思想,提出了新的面向属性相关的隐私保护方法。该方法不仅考虑了属性之间存在相关性的情况,而且利用这种相关关系减少噪声的加入。即利用最大信息系数衡量各敏感属性相关关系,构建最大信息系数矩阵;从而构造投影算子,获得投影矩阵,该结构的使用使得维度降低,在提供相同的隐私保证的情况下,所需噪声数减少。 | ||
搜索关键词: | 一种 基于 属性 相关 隐私 保护 方法 | ||
【主权项】:
1.一种基于属性相关的差分隐私保护方法,其特征在于,包含以下步骤:步骤一 设输入样本X=[X1,X2,…XN],N为样本个数,每一个样本Xl=[xl1,xl2,…,xln]T∈Rn,对输入数据X进行标准化:得到标准化矩阵计算矩阵Z的最大信息系数矩阵Ci,j=MIC(zi,zj);其特征在于:给定有序对数据集D={(xi,yi),i=1,2,...,n},将X轴分成数量为x的格子,将Y轴分成了数量为y的格子,从而得出x×y格式的网格划分,并且用G表示,把位于D点同时进入了G中的网格而存在的比例判定为它的概率分配D|G;所有的数据集D,当其具有一定的固定性时,每一个网格划分都有它自己的概率分布特征D|G;最大信息系数MIC定义为:
步骤二 数据降维,构建投影算子;数据降维是采用线性变换的方式将高维空间的数据投影变换到低维空间上;步骤三 根据投影算子,将原始数据投影到另一个空间中,得到相应的投影矩阵;计算Fk×n=Φ×Z,得到投影矩阵Fk×n;对投影矩阵Fk×n中的元素fij添加噪声,计算fij=fij+lap(Δf/ε),fij构成矩阵Fnoisy;添加服从拉普拉斯分布的噪声,其中Δf为全局敏感度;步骤四 计算D=Uk×Fnoisy+repmat(Enoisy,1,n),即将加噪后的投影矩阵还原;E为原始特征变量对应的均值,Enoisy为加噪后均值,防止均值泄露隐私;步骤五 发布还原数据集D,使得发布后的数据能够在差分隐私的框架下为相关的查询和数据挖掘等工作提供支持。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810589946.4/,转载请声明来源钻瓜专利网。