浅谈对差分隐私的理解

在听完第五组的报告之后,浅谈一下对差分隐私的认识,主要针对差分隐私的思想做一个大致的梳理。

  • 为什么会产生差分隐私?

由于有些“聪明”的用户为了知道某些信息,可以通过两次查询结果的差异进行对比,从而在两次数据的对比中找到有用的信息。正如在杨顼组的报告中提到的查询二等兵约瑟夫阿伦是否阵亡的信息,可以通过查询D5和D6两次数据结果,将两次数据结果进行对比就可以知道约瑟夫阿伦是否阵亡的消息。

  • 差分隐私的主要思想:

差分隐私是基于噪音的安全计算方法,它的思想是:对计算过程用噪音干扰,让原始数据淹没在噪音中,使别有用心者无法从得到的结果反推原始数据。

为了达到保护隐私的目的,就必须使得数据集的计算处理结果对于具体某个记录的变化是不敏感的,单个记录在数据集中或不在数据集中,对计算结果的影响微乎其微,攻击者或其他恶意用户无法通过观察结果获取准确的个体信息。

  • 那么如何才能做到插分隐私呢?

差分隐私的一般操作是加噪音,也就是在输入或输出上加入随机化的噪音,以期将真实数据掩盖掉,最常用的是拉普拉斯噪音。假设在输出的时候加随机化的噪音,使得对方在窃取到两次输出的结果基本一致,从而达到保护隐私的目的。

总的来说,差分隐私是针对统计数据库的隐私泄露问题提出的一种新的隐私定义。使用差分隐私的条件比较苛刻,从上面的介绍中可以看到在加噪音的时候需要使用与原数据分布比较类似的噪音函数,而这一条件就限制了大多数数据其实不满足插分隐私的使用条件。

原文地址:https://www.cnblogs.com/gris3/p/12397450.html

时间: 2024-08-04 07:45:30

浅谈对差分隐私的理解的相关文章

浅谈树上差分

浅谈树上差分 [引子] 我们遇到一些关于树的问题时,往往需要我们统计一些树上的信息,比如子树和,路径边覆盖.点覆盖(目前没见过别的类型).暴力的解法当然是遍历逐个点对其权值进行修改. 类比序列问题,其在进行区间修改时,可以用差分将\(O(n)\)复杂度降为\(O(1)\).在树上我们是对一条链进行处理,那差分在树上可不可用呢?答案是肯定的. [从序列到树] 在一个序列上进行差分的操作,相信各位都十分熟悉:假设当前我们要对一个序列的\(l\sim r\)区间的每个数执行\(+k\)操作,那么对于差

【转载】李航博士的《浅谈我对机器学习的理解》 机器学习与自然语言处理

李航博士的<浅谈我对机器学习的理解> 机器学习与自然语言处理 [日期:2015-01-14] 来源:新浪长微博  作者: 李航 [字体:大 中 小] 算算时间,从开始到现在,做机器学习算法也将近八个月了.虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升.实话说,机器学习很难,非常难,要做到完全了解算法的流程.特点.实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果,我觉得没有个八年十年的刻苦钻研是不可能的事情.其实整个人工智能范畴

浅谈元类(个人理解)

浅谈元类(个人理解) 我们知道在python中一切皆对象(object),那么所以有的对象都成了object的子类,那么object类又是由谁创建的呢? 实际上,能够创建类的类,叫元类.还有一个概念就是:元类创建了object类,同时又是object类的子类(这是什么鬼?我们就不去考虑这个逻辑了,已经完美解决了先有鸡还是先有蛋的问题了). 元类实际还是所有类的创建者,即使所有类(包括元类自己)都是object的子类,他们的关系如下: Interesting...... 原文地址:https://

10 浅谈 装饰器模式的理解与使用

在不改变现有类结构的情况下,为这个类添加一个新的功能,这就是装饰器模式 所属与结构型模式, 这种模式的特点是:需要创建一个装饰类来包装原有的类,并且提供额外的功能. 为了解决:平时使用继承的方式,会带入许多静态的方法,导致子类过度饱和,膨胀. 举例子:悟空拥有七十二变,不管它怎么变化,他的本质还是一只猴子,但是他又有变化后的一些本领(功能) 实现:装饰类包含原有类的实例对象,即可实现装饰器模式 开始: 定义一个形状的接口 //画图接口 public interface Shape { void

浅谈树上差分的具体应用

树上差分利用前缀和的思想,利用树上的前缀(也就是子树和),记录树上的一些信息,因为它可以进行离线操作,复杂度O(n),也是非常的好用. 最大流 FJ给他的牛棚的N(2≤N≤50,000)个隔间之间安装了N-1根管道,隔间编号从1到N.所有隔间都被管道连通了. FJ有K(1≤K≤100,000)条运输牛奶的路线,第i条路线从隔间si运输到隔间ti.一条运输路线会给它的两个端点处的隔间以及中间途径的所有隔间带来一个单位的运输压力,你需要计算压力最大的隔间的压力是多少. 这道题需要让我们求出每个点的覆

浅谈对闭包(Closure)的理解

在理解闭包前理解JavaScript的作用域是有必要的,如果有兴趣,请移步"对JavaScript作用域的认识" 什么是闭包 闭包就是指有权访问另一个函数作用域中变量的函数,通俗点讲闭包就是能够读取其他函数变量的函数.创建闭包的常见方式,就是在一个函数内部创建另一个函数. 1 function fn1() { 2 var a = 1 ; 3 function fn2() { 4 alert(a); 5 } 6 return fn2; 7 } 8 9 var result = fn1()

浅谈我对机器学习的理解

算算时间,从开始到现在,做机器学习算法也将近八个月了.虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升.实话说,机器学习很难,非常难,要做到完全了解算法的流程.特点.实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果,我觉得没有个八年十年的刻苦钻研是不可能的事情.其实整个人工智能范畴都属于科研难题,包括模式识别.机器学习.搜索.规划等问题,都是可以作为独立科目存在的.我不认为有谁可以把人工智能的各个方面都做到极致,但如果能掌握其中的

浅谈对ionic项目的理解

在思考怎么将客户端app连接到服务器的时候,就在想ionic项目的本质是什么,一开始因为ionic serve这一命令,我以为它自己就是个服务器,但是后来一细想又感觉不是这样,不然客户端又该怎么和服务端进行交互呢?而ionic本质正好验证了我的猜想. 通过ionic info我们可以发现ionic项目所需环境如下: Your system information: ordova CLI: 6.4.0 Ionic CLI Version: 2.1.17 Ionic App Lib Version:

李航博士:浅谈我对机器学习的理解

原文:http://www.itongji.cn/article/06294DH015.html 机器学习方法非常多,也很成熟.下面我挑几个说. 首先是SVM.因为我做的文本处理比较多,所以比较熟悉SVM.SVM也叫支持向量机,其把数据映射到多维空间中以点的形式存在,然后找到能够分 类的最优超平面,最后根据这个平面来分类.SVM能对训练集之外的数据做很好的预测.泛化错误率低.计算开销小.结果易解释,但其对参数调节和核函数的参 数过于敏感.个人感觉SVM是二分类的最好的方法,但也仅限于二分类.如果