题目背景:Tango是微软亚洲研究院的一个试验项目。研究院的员工和实习生们都很喜欢在Tango上面交流灌水。传说,Tango有一大“水王”,他不但喜欢发贴,还会回复其他ID发的每个帖子。坊间风闻该“水王”发帖数目超过了帖子总数的一半。如果你有一个当前论坛上所有帖子(包括回帖)的列表,其中帖子作者的ID也在表中,你能快速找出这个传说中的Tango水王吗?
方案一:就是对发帖的ID 进行排序。对排完序的ID进行查找超过一半的ID号,排序的时间复杂度为O(N*logN)。在排序的ID中判断是否出现一半的时间复杂度为O(N),因为“水王”帖子的ID一定是N/2这个数字。总的时间复杂度为O(N*logN).
方案二:用快速排序中的partion()函数来进行查找。这时候不需要将ID进行排序,只需要找出index=N/2的那个数就行了。在index之前的都小于data[index],在index之后都大于data[index]。此时其时间复杂度为O(N)。最后判断该数是不是“水王”,其时间复杂度为O(N)。
方案三:根据数据的特点和规律来查找大致思想就是:因为我们不知道那个才是“水王”,所以假设每个ID都有可能是水王,这里我们先假设第一个帖子是“水王”,那么在遍历这个水王ID的时候,就要遇到一种挑战,可能自己的帖子数是会增加的,下一个ID也可能是“水王”,那么怎么办呢?那就要比较谁的帖子数多。如果下一个帖子和该帖子相同,则帖子数增加1,技能+1;如果下一个帖子数不和该帖子数不相同,则就是有别人也可能是“水王”,这时候自己的帖子数-1,两个互相抵消,看谁能挺到最后;因为如果你是“水王”,你的帖子数一定大于其他的用户,所以最后一定是“水王”胜出。因此这样遍历下来,只有水王的帖子减去对手的帖子数会是大于0的。其他任何帖子都是不能和它斗武的。
方案三解决步骤:
(1). 假设帖子的第一个ID是次数最大的,用candidate记录,nTimes代表其出现的次数。
(2). 遍历下一个ID,如果跟candidate一样,nTimes++,否则,遇到另一个对手也可能是“水王”,则nTimes--,如果nTimes == 0,下一步就要重复第一步了。
(3). 遍历结束,nTimes>0的那个candidate就是“水王”ID,他是获胜者。
代码的具体实现:
int Find(int *arr,int lenght) { int Candidate; int nTimes,i; for(i=nTimes=0;i<lenght;i++) { if(0==nTimes) { Candidate=arr[i]; nTimes=1; } else { if(Candidate==arr[i]) nTimes++; else nTimes--; } } return Candidate;//Candidate一定是最后nTimes为1的数字; }
扩展问题:随着Tango的发展,管理员发现,“超级水王”没有了。统计结果表明,有3个发帖很多的ID,他们的发帖数目都超过了帖子总数目N的1/4。你能从发帖ID列表中快速找出他们的ID吗?
虽然题目变成了三个,但是其本质还是没有变,我们依然可以延续上面的思路来解决该问题。只不过现在又三个“水王”,依次用上面的方法,我们也会很快找到这三个,因为他们的发帖数都超过了1/4。
具体实现代码如下:
int candidate[3]; void Find(int* arr, int lenght,int *candidate) { int nTimes[3]; nTimes[0]=nTimes[1]=nTimes[2]=0; //次数初始化为0 candidate[0]=candidate[1]=candidate[2]=0; //代表三个水王; for(int i = 0; i < length; i++) { if(arr[i]==candidate[0]) { nTimes[0]++; } else if(arr[i]==candidate[1]) { nTimes[1]++; } else if(arr[i]==candidate[2]) { nTimes[2]++; } else if(nTimes[0]==0) { nTimes[0]=1; candidate[0]=arr[i]; } else if(nTimes[1]==0) { nTimes[1]=1; candidate[1]=arr[i]; } else if(nTimes[2]==0) { nTimes[2]=1; candidate[2]=arr[i]; } else { nTimes[0]--; nTimes[1]--; nTimes[2]--; } } return; }
因为只需要找出“水王”,所以思想和上面一样。