矩阵快速幂 优化dp 模板

相关博客 :https://blog.csdn.net/china_xyc/article/details/89819376#commentBox

关于能用矩阵乘法优化的DP题目,有如下几个要求:

  1. 转移式只有加法,清零,减法etc.,max和min运算不允许
  2. 转移式中关于前几位dp结果得到的系数必须是常量
  3. 转移次数一般超级多
  4. 由于转移次数多,一般都要模一个int范围内的数

综上,举一个例子:

dp[i]=a×dp[i−1]+b×dp[i−2]+c×dp[i−3]

其中,a,b,c是常量,而在需要矩阵优化的DP中,往往 i 在2^128之类的,特别鬼畜的特别大的数;
因为矩阵乘法优化后求dp[ i ] 是在O log(i)的时间内完成的。
那么,关于矩阵乘法如何实现,它的原理又是啥呢?
矩阵乘法需要两个矩阵A与B,A是n×p,B是p×m的大小,如下图

为了方便解释,我们举斐波那契的例子。
斐波那契的转移式是:dp[ i ]=dp[ i-1 ]+dp[ i-2 ]。
那么我们把(dp[ i ],dp[ i-1 ])看做一个1×2的矩阵A
而每次转移相当于把A乘以矩阵F:
|1 1|
|1 0|
得出的结果是:(dp[i]+dp[i−1],dp[i]),也就是(dp[i+1],dp[i])
那么每次进行一次矩阵乘法需要8次运算,而原先的状态转移只需要1次,这么看矩阵乘法不就一废柴算法吗。。
关键的是!矩阵乘法具有结合律, 嘿嘿嘿,那么我们就可以开始快速幂了!这样一下吧O(n)的朴素算法优化成了O(8×logn)的算法,在n炒鸡炒鸡变态大的时候我们就可以用这个优化了。

自己做到的例题 https://www.luogu.org/problem/P5343

用到的知识:集合取交集( bitset<N> 和 &=)  线性递推(DP)  矩阵加速(矩阵快速幂)  (其实有点像滚动数组)
线性递推 就是这种感觉: f ( n ) = f ( n-1 ) + f ( n-2 ) , 然后知道 f(1), f ( 2 )  的值,推出 f ( 3 ) 的值 ,再一直递推下去,是先知道前面的值再去知道后面的值的。

#include <cstdio>
#include <cstring>
#include <iostream>
#include <bitset>
#include <algorithm>
using namespace std;

typedef long long ll;
const int maxn = 105;
const int mod = 1e9+7;
ll n;
int m,x;
bitset<maxn> a,b;
ll g[maxn][maxn],tmp[maxn][maxn],res[maxn][maxn];
ll dp[maxn];

void mult(ll a[][maxn],ll b[][maxn]){
    memset(tmp,0,sizeof(tmp));
    for(int i=1; i<=100; i++){
        for(int j=1; j<=100; j++){
            for(int k=1; k<=100; k++){
                tmp[i][j] = (tmp[i][j] + a[i][k]*b[k][j]%mod)%mod;
            }
        }
    }
    for(int i=1; i<=100; i++){
        for(int j=1; j<=100; j++){
            a[i][j] = tmp[i][j];
        }
    }
}

void qpow(ll a[][maxn],ll N){
    memset(res,0,sizeof(res));
    for(int i=1; i<=100; i++){
        res[i][i] = 1;
    }
    while(N){
        if(N&1) mult(res,a);
        mult(a,a);
        N>>=1;
    }
    for(int i=1; i<=100; i++){
        for(int j=1; j<=100; j++){
            a[i][j] = res[i][j];
        }
    }
}

int main(){
    scanf("%lld%d",&n,&m);
    for(int i=0; i<m; i++){
        scanf("%d",&x);
        a[x] = 1;
    }
    scanf("%d",&m);
    for(int i=0; i<m; i++){
        scanf("%d",&x);
        b[x] = 1;
    }
    a &= b;

    for(int i=1; i<=100; i++){
        if(a[i]) g[1][i]=1;
    }
    for(int i=2; i<=100; i++){
        g[i][i-1] = 1;
    }

    // dp[0] = 1;
    // for(int i=0; i<=100; i++){
    //     for(int j=1; j<=i; j++){
    //         if(a[j]){
    //             dp[i] = (dp[i] + dp[i-j] )%mod;
    //         }
    //     }
    // }
    // if(n<=99) printf("%d\n", dp[n]);
    // else{
    //     qpow( g ,n-99);
    //     ll ans = 0;
    //     for(int i=1; i<=100; i++){
    //         ans = (ans + dp[100-i]*g[1][i]%mod) %mod;
    //     }
    //     printf("%lld\n", ans);
    // }

    //原来直接矩阵快速幂就可以啊.. 因为f(1)=0,然后当作第一位来直接做
    qpow(g,n-0);
    printf("%lld\n", g[1][1]);
}

原文地址:https://www.cnblogs.com/-Zzz-/p/11483220.html

时间: 2024-11-08 12:21:22

矩阵快速幂 优化dp 模板的相关文章

排队 矩阵快速幂优化dp

\(T1\) 排队 ? Description ?? 抢饭是高中生活的一部分,现在有一列队伍长度为 \(n\),(注意:由于人与人之间要保持距离,且不同情况所保持的距离大小不同,所以长度并不能直接体现队列的人数).已知男男之间的距离为 \(a\),男女之间距离为 bb,女女之间距离为 \(c\).一个男生打饭时间为 \(d\),一个女生打饭时间为 \(e\),求所有情况的排队时间总和(忽略身体的大小对队伍长度的贡献),答案对 $10^{9}+7 $取模. ?? Input Format 一行六个

bzoj 4000 矩阵快速幂优化DP

建立矩阵,跑快速幂 1 /************************************************************** 2 Problem: 4000 3 User: idy002 4 Language: C++ 5 Result: Accepted 6 Time:32 ms 7 Memory:836 kb 8 ****************************************************************/ 9 10 #inclu

LibreOJ #2325. 「清华集训 2017」小Y和恐怖的奴隶主(矩阵快速幂优化DP)

哇这题剧毒,卡了好久常数才过T_T 设$f(i,s)$为到第$i$轮攻击,怪物状态为$s$时对boss的期望伤害,$sum$为状态$s$所表示的怪物个数,得到朴素的DP方程$f(i,s)=\sum \frac{1}{sum+1}*(f(i+1,s')+[s==s'])$ 状态数只有$C_{8+3}^3=165$个,所以就可以矩乘优化啦.再加上一个用于转移的$1$,矩阵大小是$166*166$的,因为多组询问,所以可以先把$2$的所有次幂的矩阵都预处理出来. 然后会发现复杂度是$O(T*166^3

czy的后宫——矩阵快速幂优化DP

题意 有 n 个位置排成一行,可以放 m 种妹子.每个位置可以放也可以不放,规定某些妹子不能相邻,求方案数. 分析 #include<bits/stdc++.h> using namespace std; typedef long long ll; ll qmul(ll x,ll y,ll p){ //快速乘 x%=p; y%=p; ll ans=0; while(y){ if(y&1){ ans+=x; if(ans>=p) ans-=p; //这样写不能有负数 } x<

hdu 5411 CRB and Puzzle (矩阵快速幂优化dp)

题目:http://acm.hdu.edu.cn/showproblem.php?pid=5411 题意:按题目转化的意思是,给定N和M,再给出一些边(u,v)表示u和v是连通的,问走0,1,2.....M步的方案数. 分析:这题和 hdu5318 The Goddess Of The Moon差不多,就是多了一个等比数列求和. 代码: #include <cstdio> #include <iostream> #include <cstring> using name

poj 3744 概率dp 矩阵快速幂优化

一位童子兵要穿过一条路,路上有些地方放着地雷.这位童子兵非常好玩,走路一蹦一跳的.每次他在 i 位置有 p 的概率走一步到 i+1 ,或者 (1-p) 的概率跳一步到 i+2.童子兵初始在1位置,求他安全通过这条道路的概率. 以所在位置为状态,dp[i] 表示在位置 i 的安全的概率. dp[i] = p * dp[i-1] + (1 - p) * dp[i-2]; // i 位置没有地雷 但是题目数据的范围是 10^8 这样dp的话会 TLE. 想想可以用矩阵快速幂优化.简单退出矩阵是 |p

HDU 5863 cjj&#39;s string game ( 16年多校10 G 题、矩阵快速幂优化线性递推DP )

题目链接 题意 : 有种不同的字符,每种字符有无限个,要求用这k种字符构造两个长度为n的字符串a和b,使得a串和b串的最长公共部分长度恰为m,问方案数 分析 : 直觉是DP 不过当时看到 n 很大.但是 m 很小的时候 发现此题DP并不合适.于是想可能是某种组合数学的问题可以直接公式算 看到题解的我.恍然大悟.对于这种数据.可以考虑一下矩阵快速幂优化的DP 首先要想到线性递推的 DP 式子 最直观的想法就是 dp[i][j] = 到第 i 个位置为止.前面最长匹配长度为 j 的方案数 但是如果仔

矩阵快速幂优化递推总结

RT,主要总结一下矩阵的求法. 首先能用矩阵快速幂优化的递推类型是f[n]=5f[n-3]+6f[n-2]+2f[n-1]+n^2+n+8之类的 也就是说递推是线性递推且f[n-i]前面的系数是常数,可以含有与n有关的多项式,也可以含有常数的这种递推,下面总结一下矩阵的写法: 先考虑最简单的常数,我们其实可以忽略常数,因为顶多在没有常数的矩阵外面加一行一列就行了 以f[n]=2f[n-1]+6f[n-2]+5f[n-3]+n^2+n为例 先写迭代的矩阵,一般可以写成一行,右边有几项写几项 {f[

poj3744之矩阵快速幂+概率DP

Scout YYF I Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 4410   Accepted: 1151 Description YYF is a couragous scout. Now he is on a dangerous mission which is to penetrate into the enemy's base. After overcoming a series difficulties,