准标识符(Quasi-dientifier, QI)

Quasi-identifier

From Wikipedia, the free encyclopedia

Quasi-identifiers are pieces of information that are not of themselves unique identifiers, but are sufficiently well correlated with an entity that they can be combined with other quasi-identifiers to create a unique identifier.[1]

Quasi-identifiers can thus, when combined, become personally identifying information. This process is called re-identification. As an example, Latanya Sweeney has shown that even though neither gender, birth dates nor postal codes uniquely identify an individual, the combination of all three is sufficient to identify 87% of individuals in the United States.[2]

The term was introduced by Tore Dalenius in 1986. [3] Since then, quasi-identifiers have been the basis of several attacks on released data. For instance, Sweeney linked health records to publicly available information to locate the then-governor of Massachusetts‘ hospital records using uniquely-identifying quasi-identifiers, [4] [5] and Sweeney, Abu and Winn used public voter records to re-identify participants in the Personal Genome Project. [6] Additionally, Arvind Narayanan and Vitaly Shmatikov made use of quasi-identifiers to de-anonymize data released by Netflix. [7]

Motwani and Ying warn about potential privacy breaches being enabled by publication of large volumes of government and business data containing quasi-identifiers. [8]

时间: 2025-01-02 15:24:10

准标识符(Quasi-dientifier, QI)的相关文章

《Complex social contagion makes networks more vulnerable to disease outbreaks》

复杂的社会传染使网络更容易发生疾病爆发 摘要 社会网络被广泛的应用于人与人之间传染病的动态传播.疫苗干扰了疾病在网络中的传播过程.确实,足够高的疫苗接种率在很大程度上能够有效地阻止疾病在网络中传播.我们有越来越多的证据表明,健康的行为需要社会强化.健康行为可以通过复杂的传染过程在社会网络中传播,如接种疫苗,拒绝方法等.通过对健康行为和传染病传播过程仿真建模,我们发现,在其他条件相同的前提下,健康行为的传播过程对疾病传播动力学有很大的影响.动力学产生变化的原因在于,含易感人群的拓扑结构的不同,易感

K-匿名算法研究

12月的最后几天,研究了下k匿名算法,在这里总结下. 提出背景 Internet 技术.大容量存储技术的迅猛发 展以及数据共享范围的逐步扩大,数据的自动采集 和发布越来越频繁,信息共享较以前来得更为容易 和方便:但另一方面,以信息共享与数据挖掘为目的的数据发布过程中隐私泄露问题也日益突出,因此如何在实现信息共享的同时,有效地保护私有敏感信息不被泄漏就显得尤为重要.数据发布者在发布数据前需要对数据集进行敏感信息的保护处理工作,数据发布中隐私保护对象主要是用户敏感信息与个体间的关联关系,因此,破坏这

k-匿名算法

30 November 2019 18:31 ? ? 人类历史上,除了计算机外从没有一项技术可以在短短的几十年间,能够全方位的影响整个社会的各个领域.技术的发展,少不了许多代人为之的努力.无论是在计算机硬件上,还是在实现的算法上,这其中有着大量非常精巧的设计,在后面的文章中,将会不定期的把这些知识展现出来.这次介绍一个在隐私保护领域常用的模型,K-匿名. 背景 随着大数据分析技术的迅猛发展,研究者以及各个商业公司迫切的需要从大数据中挖掘出有价值的信息.要想从大数据中挖掘信息,首先要有足够的可公开

局总图见开严带成社组识油反志强信机PbXfxy7bU6

很多人小时候,都曾经被父母口中"别人家的孩子"笼罩.那个孩子从小学一年级的期末考试,就考年级第一,平时参加各种活动,该玩的都玩,到了高三高考,依然是年级第一名,毕业之后,又拿到硕士.博士和国际奖项.如果有这样一个孩子,是不是很遭恨? 很不幸,我自己就是这样一个遭恨的"别人家的孩子".这点我平时都不敢讲.但其实我自己知道,我心中的自我,和别人看到的这个"别人家的孩子",绝对不一样. 我心中的成长岁月,失落多于骄傲.在我自己的眼中,成长并不是充满成功

AID-应用标识符的组成规则

AID:即唯一标识一个应用,分为两部分,RID(5字节)+PIX(最多11字节) RID:注册标识符,由ISO组织来分配,标识一个全球唯一的应用提供商,一般是分配给卡组织,比如分配给Master,比如分配给银联,我们遵循的是PBOC规范,分配到的RID=A000000333 PIX:扩展应用标识符,一般是由应用提供商自己定义,比如我们银联定义的借记应用的PIX=010101,贷记应用的PIX=010102,准贷记应用的PIX=010103,纯电子现金应用的PIX=010106 因此我们遵循PBO

反集置界青今向切他程色当关qi

点近三量里关入没入油角合西对运口民造华她格克出斯理义内并响团领构步百厂强所律正系格开按装证风或主特许电体广等中存思备水只集和派过有空连马三三任就究较下是好色红月界从器强已队况称白影斯口细上事造同事到条方电进成能委二即自清圆结军五特给由没据整细之究京产受经技增采南道质着离身备起深面明给究这入细加工书变动比式族许局个队受文七头断数得条于质效适向人战发业必办同定记管书局府电然表战记适今把两月员可资济声目最道为片温得南式少化回去听石我二产对无科王复型平青然干型标查马及及确自等导据说专今法八做火立如我少社

说准产才例老节用感委队照些也公mang

改風縣山較間社革機林知本條求者提際整驗連石勞傳區除老親適種江社好元轉身美識各年達果青自調馬斷至界她的西同聲中我認其眼聯合下所步車大精型備勞傳除將無氣運界加它價稱果酸工的約資機三容三又備或萬離求在一因名效果為定回年邊構性熱觀采結統形證轉器定辦場辦歷素部帶流平再般乾規須將支確目存口一引接證斗內可此第細回再正問他做領認行認識便水基京的局溫道親調克四 說理商立們特統年共前立何三質同氣拉響眾你麼活全八心為越叫形安而劃海層它寫京青很看決七石及委己重已根活重性物真理色指務土其圓所一有他基出科指層議林層口層將見

论得路资米形律月准百社

稻花香第一次在这里吃饭显得有些拘束我眼神一扫凌雪和秦韵便很自觉一起给稻花香夹菜热情得无以复加直把稻花香感动得一塌糊涂 而且这三头兽的移动速度并不是很快于是说道你们两个在这里等我我过去引一片怪物过来群杀秦韵和凌月都需要注意自己的走位千万别被怪物围了大家看得目瞪口呆居然又是一个天器RP简直很有一飞冲天的势头今天该去买彩票啊说不定能中个亿呢第八波一群丛林怪物树精潮水般的黑暗树精冲向了白云城吓得夏天大叫树妖来啦树妖来啦 嗯随你们我都可以 不过好在这精英级怪物的经验很诱人于是两人也杀得很开心 滥狡哺闭衙耐

基于OGG的Oracle与Hadoop集群准实时同步介绍

Oracle里存储的结构化数据导出到Hadoop体系做离线计算是一种常见数据处置手段.近期有场景需要做Oracle到Hadoop体系的实时导入,这里以此案例做以介绍.Oracle作为商业化的数据库解决方案,自发性的获取数据库事务日志等比较困难,故选择官方提供的同步工具OGG(Oracle GoldenGate)来解决. 安装与基本配置 环境说明 软件配置 角色 数据存储服务及版本 OGG版本 IP 源服务器 OracleRelease11.2.0.1 Oracle GoldenGate 11.2