寻找出现次数为1的ID的问题

问题描述:

在一张表里面保存了N个ID,有N-1个ID是出现了两次的,只有一个ID只出现了一次,现在要你把这个ID找出来。如果是两个呢?

解法一:

我们先来解决一个的。假如ID的值的范围是1-k,当这个k不大的时候,我们可以直接开一个数组,把表扫一遍,记录下每个ID出现的次数,这样,出现一次的就的出来了,这样做的时间复杂度是O(n),空间复杂度也是O(n)。

解法二:

然而,当k很大很大时,这种做法显然就不行了。然后我们提出第二种对这种优化的方法,就是利用哈希,对每个ID哈希一遍,保存在哈希表里,然后,当我在插入的时候发现,这个ID已经出现过的时候,就把这个ID从哈希表里面删除掉,最后剩下只有一个ID,那就是只出现过一次的ID。这样时间复杂度仍然是O(n),其实时间复杂度O(n)已经没有什么可以优化的空间了。关键是空间复杂度能不能优化到O(1)呢?

解法三:

优化到O(1),也就是说,只有使用一个变量,这也就意味着,这个变量最后保存的值就是我们要找的ID。我们可以这样描述这个过程:

ID = f(A[0 : n-1])

关键就是怎样设计这个f()。

这里有一个很巧妙的方法。我们知道两个数异或有这样的性质:

a ^ a = 0

a ^ 0 = a

而且异或满足交换律,所以如果ID是这样一个集合,我们对其进行异或遍历:  a1,a1,a2,a2,a3,a3,.....ak,ak.....an,an

我们令ak是我们要找的那个ID,这个ID列表是没有顺序的,也就是说相同的ID不一定是相邻的,所以假设是这样的:

ak1 ^ ak2 ^ ak3......akn这个顺序我们是未知的,但利用异或满足交换律这个特点,可以这样:

ak1 ^ ak2 ^ ak3......akn

= a1 ^ a1 ^ a2 ^ a2 ^ ak-1 ^ ak+1 ..... ^ an ^ ak

而a1 ^ a1 = 0,所以前n-1个异或的结果为0,最后剩下

0 ^ ak = 0

所以,最后异或的结果就是只出现一个的那个ID。

然后,如果是两个呢?如果两个A和B,ID只出现一次呢?怎样在O(n)时间跟O(1)空间的条件下找到这两个ID呢?

像上一种方法一样,直接异或遍历,只能得到两个ID异或的结果,不能得到两个ID。

我们可以顺势就在这两个ID异或的结果上面做文章,假如异或结果为0,说明是两个相等的ID,这里先不做讨论,假如异或的结果不为0,那么结果至少有一位上为1的,这就说明,A跟B至少在这一位上是不相等的,所以,我们可以把这一位所有相同的ID分别放在一类,这样就得到一类是这一位是1的一类,我们称这是X类,另一类的这一位是0的一类,称为Y类,因为其它的n-2的ID是完全相同的,所以,如果一个ID在这一位是1,那么这两个ID一定同时被分在X类中,所以最终的结果是X类中有一个A或者B ID,Y类中有一个A或者B  ID ,但可以肯定的是A跟B一定不在同一类中,所以,我们又可以分别对这两类ID进行异或,又可以得到A和B

时间: 2024-10-12 21:23:06

寻找出现次数为1的ID的问题的相关文章

寻找出现次数最多的id

题目要求: 论坛中有一个id评论过于频繁,其出现次数占到3/4,如今简单编程寻找此id. 设计思想: 既然大篇幅的出现,则可以考虑用删除的方法,首先将出现过的id存入在一个数组里,然后进行遍历,只要前后两个id不一样则进行删除. 通过这样的方法就可以找出回复次数最多的那个id了,即"水王". package zuoYe; import java.util.Scanner; /* * 寻找水王 */ public class ShuiWang2 { public static void

POJ 3693 Maximum repetition substring (寻找重复次数最多的连续子串)

Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9083   Accepted: 2782 Description The repetition number of a string is defined as the maximum number R such that the string can be partitioned into R same conse

Spark实战--寻找5亿次访问中,访问次数最多的人

问题描述 对于一个大型网站,用户访问量尝尝高达数十亿.对于数十亿是一个什么样的概念,我们这里可以简单的计算一下.对于一个用户,单次访问,我们通常会记录下哪些数据呢? 1.用户的id 2.用户访问的时间 3.用户逗留的时间 4.用户执行的操作 5.用户的其余数据(比如IP等等) 我们单单从用户id来说,比如10011802330414,这个ID,那么我们一个id差不多就是一个long类型,因为在大量数据存储的时候,我们都是采用文本存储.因此对于5亿个用户ID,完全存储在磁盘当中,大概是5G的大小,

编程之美2.3——寻找水军(抵消法)

1.在数组中寻找出现次数超过一半的一个元素. 2.在数组中寻找出现次数超过1/4的三个元素. [思路] 1)常规做法:先将数组排序,时间O(nlogn):再遍历一次,统计每个元素出现的次数,得到题目要求. 2)时间O(n)的做法:抵消法.对于第一题,每次抵消两个不同的数,剩下的数组主元素出现次数还是超过一半.即缩小题目规模的思想. 对于第二题,则每次抵消4个数,转化为规模较小的问题. 抵消两个数的代码很简单: int findOverHalf(int *ID, int N){ int ntime

第2章 数字之魅——寻找发帖“水王”

寻找发帖“水王” 问题描述 Tango是微软亚洲研究院的一个试验项目.研究院的员工和实习生们都很喜欢在Tango上面交流灌水.传说,Tango有一大"水王",他不但喜欢发贴,还会回复其他ID发的每个帖子.坊间风闻该"水王"发帖数目超过了帖子总数的一半.如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗? 解法 采用Map存储每个ID和它出现的次数,之后遍历一遍Map找出其中的“水王”,时间复杂度为O

软件工程课堂作业——寻找“水王”

一.题目 三人行设计了一个灌水论坛.信息学院的学生都喜欢在上面交流灌水,传说在论坛上有一个“水王”,他不但喜欢发帖,还会回复其他ID发的每个帖子.坊间风闻该“水王”发帖数目超过了帖子数目的一半. 如果你有一张当前论坛的帖子(包括回帖)列表,其中帖子的作者的ID也在其中,你能快速的找到这个传说中的水王吗? 二.设计思想: 由于该“水王”发帖数目超过了帖子数目的一半,可以通过相邻两个帖子的作者ID是否相同来寻找.如果相邻两个ID不同,则将两个ID略过:若相等,则判断之前是否有怀疑是“水王”的ID,如

删除字符串中出现次数最少的字符

题目描述 实现删除字符串中出现次数最少的字符,若多个字符出现次数一样,则都删除.输出删除这些单词后的字符串,字符串中其它字符保持原来的顺序. 输入描述: 字符串只包含小写英文字母, 不考虑非法输入,输入的字符串长度小于等于20个字节. 输出描述: 删除字符串中出现次数最少的字符后的字符串. 输入例子: abcdd 输出例子: dd 思路:(我的思路有点绕弯,先记录下来,后面有网友简洁思路),首先把字符串元素存入list中,继续以key-字符,value-出现次数存入map中,然后map按照val

计算指定字符串出现次数插件

计算指定字符串出现次数插件: 有时候需要计算移一段字符串中指定字符串的出现次数,可能应用不是那么频繁. 本章节分享一段代码实例能够实现类似的功能,当然也可以根据实际需要进行扩展. 代码如下: <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta name="author" content="http://www.51texiao.cn/&q

网页文章浏览次数

文章浏览次数,顾名思义就是点击一次,或者刷新页面,次数就加1,. 首先要做的就是在表中加一个字段用来表示浏览次数,本文中的字段是views. 这是主方法: /// <summary> /// 修改浏览次数 /// </summary> /// <param name="id"></param> public static void UpdateViews( int id) { string strSql = string .Format(