P5325 【模板】Min_25筛
题目背景
模板题,无背景。
题目描述
定义积性函数$f(x)$,且$f(p^k)=p^k(p^k-1)$($p$是一个质数),求
$$\sum_{i=1}^n f(x)$$
对$10^9+7$取模。
输入输出格式
输入格式:
一行一个整数$n$。
输出格式:
一个整数表示答案。
输入输出样例
输入样例#1:
复制
10
输出样例#1:
复制
263
输入样例#2:
复制
1000000000
输出样例#2:
复制
710164413
说明
$f(1)=1,f(2)=2,f(3)=6,f(4)=12,f(5)=20$
$f(6)=12,f(7)=42,f(8)=56,f(9)=72,f(10)=40$
对于$30\%$的数据,保证$1\le n\le 10^6$。
对于$100\%$的数据,保证$1\le n\le 10^{10}$
wucstdio的题解
题意
求\(\sum_{i=1}^nf(i)\),其中\(f(i)\)是一个积性函数,且\(f(p^k)=p^k(p^k-1)\)。
Min_25筛
为什么这个筛法叫做Min25筛呢?因为这个算法是Min25发明的。
假设我们要求一个\(\sum_{i=1}^nf(i)\),满足\(f(x)\)是一个积性函数,且\(f(p^e)\)是一个关于\(p\)的低阶多项式。
因为多项式可以拆成若干个单项式,所以我们只需要考虑求出\(f(p)=p^k\)的前缀和,然后每一项加起来就行了。
那么如何求出每一项的和呢?
-
分类
让我们先对\(i\)按照质数和合数分类:
\[\sum_{i=1}^nf(i)=\sum_{1\le p\le n}f(p)+\sum_{i=1\&\text{i is not a prime}}^nf(i)\]
然后,我们枚举后面合数的最小质因子以及最小质因子的次数。注意所有合数的最小质因子一定都小于等于\(\sqrt n\):
\[\sum_{1\le p\le n}f(p)+\sum_{1\le p^e\le n,1\le p\le \sqrt n}f(p^e)\left(\sum_{1\le i\le n/p^e\&minp>p}f(i)\right)\]
其中\(minp\)表示\(i\)的最小质因子,因为公式中文太丑了所以就只好写英文了。
这样,整个式子就变成了两个部分,第一部分是所有质数的\(f\)之和,另一部分是枚举最小质因子后,求所有最小质因子大于这个质因子的\(f\)之和。
-
辅助函数
由于\(n\)实在太大,所以我们没法用线性筛求出所有质数的\(f\)和。
我们考虑一个DP的思路(天哪这是怎么想到的):我们不知道从哪里找来了一个DP数组\(g(n,i)\),满足
\[g(n,j)=\sum_{i=1}^n[\text{i is a prime or minp$> p_j$}]i^k\]
这里的\(k\)就是前面我们说的低阶多项式的一项(此题中\(k\in\{1,2\}\))。注意\(i^k\)并不是我们要求的\(f\),只是一个和\(f\)在质数处的取值一样的完全积性函数,这样后面计算起来比较方便。
这个式子说人话就是\(g(n,j)\)表示求\(1\)到\(n\)之间所有满足条件的数的\(k\)次方和,条件就是要么是质数要么最小质因子大于\(p_j\)。
我们考虑\(g(n,j-1)\)如何转移到\(g(n,j)\)。随着\(j\)的增大,满足条件的数变少了,所以我们需要减去一些原来满足条件而现在不满足条件的数。
这些数应该是最小质因子恰好为\(p_{j}\)的合数。
我们可以提出来一个\(p_{j}\)作为最小质因子,这样剩下的就不能有小于它的质因子了,也就是\(g\left(\dfrac{n}{p_{j}},j\right)-g(p_{j-1},j-1)\),后面那个\(g\)是为了把所有的质数去掉。
这样我们就得到了\(g\)的递推式:
\[g(n,j)=g(n,j-1)-p_j^k\left(g\left(\dfrac{n}{p_j},j\right)-g(p_{j-1},j-1)\right)\]
完全积性函数的好处在这里就体现出来了:由于只提出了一个\(p_i\),所以后面还有可能有\(p_i\)这个因子,如果是完全积性函数的话就可以将函数值直接相乘,而不用管是否互质。
注意到后面的\(g(p_{j-1},j-1)\)其实就是前\(j-1\)个质数的\(k\)次方和。由于\(p_j\le \sqrt n\),所以这一部分可以用线性筛预处理,我们设\(sp_n=\sum_{i=1}^np_i^k\),也就是前\(n\)个质数的\(k\)次方和。
\(1\)到\(n\)中所有质数的\(k\)次方和其实就是\(g(n,x)\),其中\(p_x\)是最后一个小于等于\(\sqrt n\)的质数。为了方便,我们把它记作\(g(n)\)。
但是因为\(n\)太大,我们还是没法对于每一个\(n\)求出\(g(n,x)\),所以我们可以想到另一个重要的结论:
\[\left\lfloor\dfrac{\lfloor\dfrac na\rfloor}{b}\right\rfloor=\lfloor\dfrac{n}{ab}\rfloor\]
也就是说,无论你每一次把\(n\)除以几,最后你能得到的数一定是某一个\(\lfloor\dfrac nx\rfloor\),所以我们没必要算出来所有的\(n\),只需要算出可以写成\(\lfloor\dfrac{n}{x}\rfloor\)这种形式的数,这样的数一共有\(O(\sqrt n)\)个。
那么我们如何存储这\(\sqrt n\)个数呢?
首先我们不能直接下标访问,这样下标可以到\(n\)。我们需要对下标离散化。
但是离散化之后,我们还需要知道对于每一个\(\lfloor\dfrac nx\rfloor\),它对应的下标是什么。
如果偷懒的话可以用map,但是时间复杂度会多一个\(\log\)。我们可以用\(ind1[x]\)表示\(x\)这个数对应的数组下标,\(ind2[x]\)表示\(n/x\)这个数对应的下标。这样两个\(ind\)数组最大都只会到\(\sqrt n\)。
具体实现可以看代码。数组的记录上需要精细实现一下。
-
求解答案
答案就是先求出所有质数的函数和,然后先枚举了一个\(p^e\),再枚举最小质因子大于\(p\)的数。
我们还是可以考虑DP的思想。设\(S(n,x)\)表示求\(1\)到\(n\)中所有最小质因子大于\(p_x\)的函数值之和,注意这里是\(f\)而不是\(k\)次方。答案就是\(S(n,0)\)。
我们将满足条件的数分成两部分,第一部分是大于\(p_x\)的质数,也就是\(g(n)-sp_x\),另一部分是最小质因子大于\(p_x\)的合数,枚举最小质因子:
\[S(n,x)=g(n)-sp_x+\sum_{p_k^e\le n\&k>x}f(p_k^e)\left(S\left(\dfrac{n}{p_k^e},k\right)+[e\neq 1]\right)\]
这样问题就解决了,我们可以递归求解这个问题。根据某玄学定理,不需要记忆化。
一些细节
\(1\)既不是质数也不是合数,不含任何一个质因子,那么求解的过程中\(g\)和\(S\)到底是否包含\(1\)呢?其实是否包含都可以,但是处理上略有差别。我的\(g\)和\(S\)都没有包含\(1\),只需要最后加一就行了。
min25筛的时间复杂度据说是\(O\left(\dfrac{n^{3/4}}{\log n}\right)\),也有人说是\(O(n^{1-\epsilon})\),在这道题上大致是1e10跑1s左右的样子。但是这个算法常数很小,具体表现参加WC2019课件里面的一张图:(灰色的是min25)
#include<bits/stdc++.h>
#define il inline
#define co const
template<class T>T read(){
T data=0,w=1;char ch=getchar();
for(;!isdigit(ch);ch=getchar())if(ch=='-') w=-w;
for(;isdigit(ch);ch=getchar()) data=data*10+ch-'0';
return data*w;
}
template<class T>il T read(T&x) {return x=read<T>();}
typedef long long LL;
using namespace std;
co int mod=1e9+7,i2=500000004,i6=166666668;
il int add(int a,int b){
return (a+=b)>=mod?a-mod:a;
}
il int mul(int a,int b){
return (LL)a*b%mod;
}
//int fpow(int a,int b){ // calc inv
// int ans=1;
// for(;b;b>>=1,a=mul(a,a))
// if(b&1) ans=mul(ans,a);
// return ans;
//}
co int N=2e5+1; // edit 1: size
LL n;
int sqr,pri[N],num,sp1[N],sp2[N];
LL w[N];int tot,g1[N],g2[N],ind1[N],ind2[N];
void init(){
pri[1]=1;
for(int i=2;i<=sqr;++i){
if(!pri[i]){
pri[++num]=i;
sp1[num]=add(sp1[num-1],i);
sp2[num]=add(sp2[num-1],mul(i,i));
}
for(int j=1;j<=num&&i*pri[j]<=sqr;++j){
pri[i*pri[j]]=1;
if(i%pri[j]==0) break;
}
}
}
int S(LL x,int y){
if(pri[y]>=x) return 0;
int k=x<=sqr?ind1[x]:ind2[n/x];
int ans=add(add(g2[k],mod-g1[k]),mod-add(sp2[y],mod-sp1[y]));
for(int i=y+1;i<=num&&(LL)pri[i]*pri[i]<=x;++i){
LL p=pri[i];
for(int e=1;p<=x;++e,p=p*pri[i]){
int t=p%mod;
ans=add(ans,mul(t,mul(t-1,add(S(x/p,i),e!=1))));
}
}
return ans;
}
int main(){
sqr=ceil(sqrt(read(n))),init();
// part 1
for(LL l=1,r;l<=n;l=r+1){ // init g(w,0)
r=n/(n/l);
w[++tot]=n/l; // big->small
g1[tot]=g2[tot]=w[tot]%mod;
g1[tot]=mul(i2,mul(g1[tot],g1[tot]+1)),g1[tot]=add(g1[tot],mod-1);
g2[tot]=mul(i6,mul(g2[tot],mul(g2[tot]+1,2*g2[tot]+1))),g2[tot]=add(g2[tot],mod-1);
if(n/l<=sqr) ind1[n/l]=tot;
else ind2[n/(n/l)]=tot;
}
for(int i=1;i<=num;++i) // DP g(w,i)
for(int j=1;j<=tot&&(LL)pri[i]*pri[i]<=w[j];++j){
int k=w[j]/pri[i]<=sqr?ind1[w[j]/pri[i]]:ind2[n/(w[j]/pri[i])];
g1[j]=add(g1[j],mod-mul(pri[i],add(g1[k],mod-sp1[i-1])));
g2[j]=add(g2[j],mod-mul(pri[i],mul(pri[i],add(g2[k],mod-sp2[i-1]))));
}
// part 2
printf("%d\n",add(S(n,0),1));
return 0;
}
这题数组空间,我开刚好\(\sqrt{n}\),也就是1e5,就会炸掉。试了一下开到2e5才过。大概是数据有问题。
原文地址:https://www.cnblogs.com/autoint/p/11113256.html