矩阵的特征值分解

引入问题：给定一个对角线非零的上三角矩阵\(M\)，求\(M^k\)，满足\(M\)的阶\(\le 500\)，\(k\le 10^9\)。

对998244353取模。

一个显而易见的算法是矩阵快速幂，然而是\(O(N^3\log k)\)的，无法通过本题。

~~一开始我想，既然是上三角矩阵，那么特征多项式一定不难求，那么是用CH定理+FFT多项式取模啥搞搞？~~

然而我naive了。

这题我们可以把\(M\)特征值分解为\(Q^{-1}AQ\)形式，其中\(A\)是一个对角矩阵。

那么\(M^k=(Q^{-1}AQ)^k=Q^{-1}A^kQ\)。

对一个对角矩阵进行幂的复杂度是\(N\log C\)的，矩阵乘法的复杂度是\(O(N^3)\)的，对一个上三角矩阵进行特征值分解可以使用高斯消元，时间复杂度也是\(O(N^3)\)，具体怎么对上三角矩阵进行特征值分解？？~~我tm怎么知道~~，这个得好好研究一下

upd

自己手推没推出来。观察了下std，手跑了下样例，得出来一些性质。

矩阵\(Q^{-1}\)的第\(i\)列，即为矩阵\(M\)对应第\(i\)行第\(i\)列特征值的特征向量。

这个性质通过特征值分解那套理论也不难得到--因为特征向量是\(M\)所对应“方向不变”的向量，而\(Q\)和\(Q^{-1}\)就是在这些旋转方向上的向量，通过线性变换把它们旋转过去//线代那套理论太玄学

~~std里在\(Q^{-1}\)上递推的，没有看得非常透彻(不过大致也观察出了一些什么)~~，目前已经观察得比较透彻了。

求出\(Q^{-1}\)后直接上矩阵求逆板子求\(Q\)，然后直接矩阵乘法就行了。

代码如下：

#include <cstdio>
using namespace std;

const int p = 998244353;

int n, k, a[500][500], l[500][500], r[500][500], v[500];

int qpow(int x, int y)
{
    int res = 1;
    for (x %= p; y > 0; y >>= 1, x = x * (long long)x % p)
        if (y & 1) res = res * (long long)x % p;
    return res;
}

int main()
{
    scanf("%d%d", &n, &k);
    for (int i = 0; i < n; i++)
        for (int j = 0; j < n; j++)
            scanf("%d", &a[i][j]);

    //求l
    for (int i = 0; i < n; i++) //枚举l矩阵的第i列，为a矩阵对应于aii的特征向量
    {
        l[i][i] = 1; //钦定的
        for (int j = i - 1; j >= 0; j--) //求这个特征向量的第j行的值
        {
            int sum = 0; //这里需要满足的是\sum_{k=0}^{n-1}a_{j,k}*l{k,i}=0，此时求值为$b_{ji}$
            for (int k = j + 1; k <= i; k++)
                sum = (sum + a[j][k] * (long long)l[k][i]) % p;
            l[j][i] = sum * (long long)qpow((a[i][i] - a[j][j] + p) % p, p - 2) % p;
            //注意这里是a[i][i] - a[j][j]， 相当于乘了个-1，就是我们要求的值了
        }
    }

    //求l的逆矩阵r，注意到l是上三角矩阵
    for (int i = n - 1; i >= 0; i--)
    {
        r[i][i] = qpow(l[i][i], p - 2);
        for (int j = 0; j < i; j++)
        {
            int e = l[j][i] * (long long)qpow(l[j][j], p - 2) % p;
            for (int k = i; k < n; k++)
                r[j][k] = ((r[j][k] - r[i][k] * (long long)e % p) % p + p) % p;
        }
    }

    //收集答案
    for (int i = 0; i < n; i++) v[i] = qpow(a[i][i], k);

    long long ans1 = 0, ans2 = 0;

    for (int i = 0; i < n; i++)
        for (int j = i; j < n; j++)
        {
            int sb = 0;
            for (int k = i; k <= j; k++)
                sb = (sb + l[i][k] * (long long)v[k] % p * r[k][j] % p) % p;
            ans1 += sb, ans2 ^= sb;
        }
    printf("%lld %lld\n", ans1, ans2);
    return 0;
}

以后再研究下一般矩阵的特征值分解，就可以弄图片压缩啥的了。

这个代码常数略大，本来可以弄小一点的

把最后收集答案时候先让对角矩阵和l乘一下再收集、以及优化一下(x%p+p)%p那部分即可。

原文地址：https://www.cnblogs.com/oier/p/10291286.html

时间： 2024-10-09 00:19:40

矩阵的特征值分解

矩阵的特征值分解的相关文章

矩阵的“特征值分解”和“奇异值分解”区别

矩阵的特征值分解和奇异值分解

矩阵的SVD分解

机器学习基础篇——矩阵特征值分解含义解析及应用

矩阵特征值分解与奇异值分解含义解析及应用

讲一下numpy的矩阵特征值分解

利用QR算法求解矩阵的特征值和特征向量

特征值分解，奇异值分解（SVD）

特征值分解和SVD