线筛,时间复杂度O(N log log N)
原理比较易懂,因为合数可以被分解为两个因数。
所以可以反过来,两个因数的乘积必定不是质数。
所以,通过一次次的枚举两个因数,合数就被“筛选”掉了,只留下质数在筛子里。
按照上述的原理,核心代码本应该是这样的:
bool vis[MAXN] = {true, true, false}; for(i = 2; i <= N; i++) { for(j = 2; i*j <= N; j++) { vis[i*j] = true; //枚举两个因数,他们的乘积必定不是质数,所以筛掉 } }
然后vis[]数组里为false的的就是质数。
但是,我们还要加上下面几个必要的优化:
1.首先,我们姑且称上面代码循环体中的i为基底因数,j为筛选因数。
我们可以把i,j的筛选看成关于基底因数的筛选。
那么,筛质数时,为了优化时间,我们必须要保证筛选因数要大于等于基底因数,即j >= i。
为什么只用大于等于i的筛选因数呢?
我们可以想到,假设我们选了一个小于i的j,那么这个j一定先于i,开始了关于j基底因数的筛选。
那么,因为i*j = j*i,那么i、j这两个数已经在之前关于j基底因数的筛选中,被分别作为筛选因数和基底因数被筛过一次了。
如果我们现在把i、j这两个数分别作为基底因数和筛选因数再筛一次,岂不是重复了么?
所以,因为没有必要去重复做两次工作,所以小于基底因数的筛选因数,我们可以舍掉不算。
2.其次,我们只需要把质数作为基底因数去筛选。
因为合数可以被分解为很多质因数,所以把合数再筛一次,相当于重复做了它的质因数的工作。
又因为,筛法求质数中,筛过的质数表的范围是当前基底质数的平方。
所以,因为当N大于2时,N < (N-1)^2。所以我们可以将这个筛了一部分范围的质数表拿来用。
综上,我们首先把N标记为质数,然后向后一个个枚举,如果在当前质数表里是合数,就跳过。如果在当前质数表里是质数,就开始筛选。
3.因为筛过的质数表的范围是当前基底质数的平方。
所以,我们只用枚举基底质数一直枚举到(√N)+1就行了。
至于为什么要加一?因为基底质数一定是个整数,所以如果直接用√N可能会漏掉几个。加上1纯属保险。
下面是优化过的代码:
洛谷OJP3383 模板线性筛质数:1647ms
#include <stdio.h> #include <math.h> bool vis[10000000+10] = {true, true}; void prim(int N) { int to = sqrt(N)+1, i, j; for(i = 2; i <= to; i++) if(!vis[i]) { for(j = i*i; j <= N; j += i) vis[j] = true; } } int main() { int N, M, i, a; scanf("%d%d", &N, &M); prim(N); for(i = 1; i <= M; i++) { scanf("%d", &a); if(vis[a]) printf("No\n"); else printf("Yes\n"); } }
原创码字,供学习交流使用,请勿抄袭!