LIS/LCS/LCIS

1.最长上升子序列

2.最长公共子序列

对于两个序列X={x1,x2,x3...x...},Y={y1,y2,y3... yi...}

3.最长上升公共子序列

以下摘自刘汝佳《最长公共上升子序列(LCIS)的O(n^2)算法》

预备知识:动态规划的基本思想,LCS,LIS。

问题:字符串a,字符串b,求a和b的LCIS(最长公共上升子序列)。

首先我们可以看到,这个问题具有相当多的重叠子问题。于是我们想到用DP搞。DP的首要任务是什么?定义状态。

定义状态F[i][j]表示以a串的前i个字符b串的前j个字符且以b[j]为结尾构成的LCIS的长度。

为什么是这个而不是其他的状态定义?最重要的原因是我只会这个,还有一个原因是我知道这个定义能搞到平方的算法。而我这只会这个的原因是,这个状态定义实在是太好用了。这一点我后面再说。

我们来考察一下这个这个状态。思考这个状态能转移到哪些状态似乎有些棘手,如果把思路逆转一下,考察这个状态的最优值依赖于哪些状态,就容易许多了。这个状态依赖于哪些状态呢?

首先,在a[i]!=b[j]的时候有F[i][j]=F[i-1][j]。为什么呢?因为F[i][j]是以b[j]为结尾的LCIS,如果F[i][j]>0那么就说明a[1]..a[i]中必然有一个字符a[k]等于b[j](如果F[i][j]等于0呢?那赋值与否都没有什么影响了)。因为a[k]!=a[i],那么a[i]对F[i][j]没有贡献,于是我们不考虑它照样能得出F[i][j]的最优值。所以在a[i]!=b[j]的情况下必然有F[i][j]=F[i-1][j]。这一点参考LCS的处理方法。

那如果a[i]==b[j]呢?首先,这个等于起码保证了长度为1的LCIS。然后我们还需要去找一个最长的且能让b[j]接在其末尾的LCIS。之前最长的LCIS在哪呢?首先我们要去找的F数组的第一维必然是i-1。因为i已经拿去和b[j]配对去了,不能用了。并且也不能是i-2,因为i-1必然比i-2更优。第二维呢?那就需要枚举b[1]..b[j-1]了,因为你不知道这里面哪个最长且哪个小于b[j]。这里还有一个问题,可不可能不配对呢?也就是在a[i]==b[j]的情况下,需不需要考虑F[i][j]=F[i-1][j]的决策呢?答案是不需要。因为如果b[j]不和a[i]配对,那就是和之前的a[1]..a[j-1]配对(假设F[i-1][j]>0,等于0不考虑),这样必然没有和a[i]配对优越。(为什么必然呢?因为b[j]和a[i]配对之后的转移是max(F[i-1][k])+1,而和之前的i`配对则是max(F[i`-1][k])+1。显然有F[i][j]>F[i`][j],i`>i)

于是我们得出了状态转移方程:

a[i]!=b[j]:   F[i][j]=F[i-1][j]

a[i]==b[j]:   F[i][j]=max(F[i-1][k])+1 1<=k<=j-1&&b[j]>b[k]

不难看到,这是一个时间复杂度为O(n^3)的DP,离平方还有一段距离。

但是,这个算法最关键的是,如果按照一个合理的递推顺序,max(F[i-1][k])的值我们可以在之前访问F[i][k]的时候通过维护更新一个max变量得到。怎么得到呢?首先递推的顺序必须是状态的第一维在外层循环,第二维在内层循环。也就是算好了F[1][len(b)]再去算F[2][1]。

如果按照这个递推顺序我们可以在每次外层循环的开始加上令一个max变量为0,然后开始内层循环。当a[i]>b[j]的时候令max=F[i-1][j]。如果循环到了a[i]==b[j]的时候,则令F[i][j]=max+1。

最后答案是F[len(a)][1]..F[len(a)][len(b)]的最大值。

参考代码:

#include<cstdio>
#include<cstring>
int f[1005][1005],a[1005],b[1005],i,j,t,n1,n2,max;
int main()
{
    scanf("%d",&t);
    while(t--)
    {
        scanf("%d%d",&n1,&n2);
        for(i=1;i<=n1;i++) scanf("%d",&a[i]);
        for(i=1;i<=n2;i++) scanf("%d",&b[i]);
        memset(f,0,sizeof(f));
        for(i=1;i<=n1;i++)
        {
            max=0;
            for(j=1;j<=n2;j++)
            {
                f[i][j]=f[i-1][j];
                if (a[i]>b[j]&&max<f[i-1][j]) max=f[i-1][j];
                if (a[i]==b[j]) f[i][j]=max+1;
            }
        }
        max=0;
        for(i=1;i<=n2;i++) if (max<f[n1][i]) max=f[n1][i];
        printf("%d\n",max);
    }
}

4.最大子序和

(1)改进的穷举法O(n^2)

int MaxSubSum(int *arr, int n)
{
    int MaxSum = 0, ThisSum;
    for(int i = 0; i < n; i++)
    {
        ThisSum = 0;  // ThisSum减少了O(n^3)中的重复计算
        for(int j = i; j < n; j++)
        {
            ThisSum += arr[j];
            MaxSum = max(MaxSum, ThisSum);
        }
    }
    return MaxSum;
}

(2)分治法O(nlogn)

#include <stdio.h>
#include <iostream>
using namespace std;

int MaxSubSum(int *arr, int left, int right)
{
    if(left == right)
        return (arr[left] < 0) ? 0 : arr[left];

    int LMaxSum, RMaxSum, CMaxSum;
    int center = (left + right) / 2;
    LMaxSum = MaxSubSum(arr, left, center);
    RMaxSum = MaxSubSum(arr, center+1, right);

    // 左部包含右端结点的最长子序列
    int LLMaxSum = 0, LLThisSum = 0;
    for(int i = center; i >= left; i--)
    {
        LLThisSum += arr[i];
        LLMaxSum = max(LLMaxSum, LLThisSum);
    }
    // 右部包含左端结点的最长子序列
    int RRMaxSum = 0, RRThisSum = 0;
    for(int i = center+1; i <= right; i++)
    {
        RRThisSum += arr[i];
        RRMaxSum = max(RRMaxSum, RRThisSum);
    }
    // 跨越左右两部分的最长子序列
    CMaxSum = LLMaxSum + RRMaxSum;

    return max(max(LMaxSum, RMaxSum), CMaxSum);
}

int main()
{
    int arr[12] = {-6, 2, 4, -7, 5, 3, 2, -1, 6, -9, 10, -2};
    printf("ans = %d\n", MaxSubSum(arr, 0, 11));
}

(3)动态规划法O(n)

int MaxSubSum(int *arr, int n)
{
    int MaxSum = 0, ThisSum = 0;
    for(int i = 0; i < n; i++)
    {
        ThisSum += arr[i];
        if(ThisSum < 0)  // 说明此段不可能作为最大上升子序列的前缀
            ThisSum = 0;
        MaxSum = max(MaxSum, ThisSum);  // 但此段中出现的最大上升子序列对结果可能有影响
    }
    return MaxSum;
}
时间: 2024-10-23 23:19:12

LIS/LCS/LCIS的相关文章

LIS &amp;&amp; LCS &amp;&amp; LCIS模板

1. LIS O (n^2): /* LIS(Longest Increasing Subsequence) 最长上升子序列 O (n ^ 2) 状态转移方程:dp[i] = max (dp[j]) + 1 (a[j] < a[i],1 <= j < i) 附带有print输出路径函数 */ void LIS(void) { int ret = 0, last = 0; for (int i=1; i<=n; ++i) { dp[i] = 1; fa[i] = -1; for (i

最长上升子序列 CSU - 1047 ( LIS LCS )

名词解释: 一串数字比如1.5.3.6.9.8.10,它的子序列是从左到右不连续的若干个数,比如1.5.6,3.9.8.10都是它的子序列. 最长上升子序列即从左到右严格增长的最长的一个子序列,1.5.6.9.10就是这个序列的一个最长上升子序列. 给出若干序列,求出每个序列的最长上升子序列长度. Input 多组数据,每组第一行正整数n,1 <= n <= 1000,第二行n个空格隔开的不大于1,000,000的正整数. Output 每组数据输出一行,最长上升子序列的长度. Sample

bzoj1264 基因匹配Match (lcs转lis lcs(nlogn))

基因匹配Match 内存限制:256 MiB 时间限制:1000 ms 标准输入输出 题目描述 基因匹配(match) 卡卡昨天晚上做梦梦见他和可可来到了另外一个星球,这个星球上生物的DNA序列由无数种碱基排列而成(地球上只有4种),而更奇怪的是,组成 DNA序列的每一种碱基在该序列中正好出现5次!这样如果一个DNA序列有N种不同的碱基构成,那么它的长度一定是5N. 卡卡醒来后向可可叙述了这个奇怪的梦,而可 可这些日子正在研究生物信息学中的基因匹配问题,于是他决定为这个奇怪星球上的生物写一个简单

LIS LCS 最长上升子序列 最长公共子序列 ...

最长上升子序列,问题定义:http://blog.csdn.net/chenwenshi/article/details/6027086 代码: public static void getData( char[] L ) { int len = L.length; int[] f = new int[len]; String[] res = new String[len]; for( int i = 1; i < len; i++ ) { f[i] = 1; res[i] = "&quo

LIS,LCS,LICS模板

最长递增子序列模板(1) #include<iostream> #include<algorithm> #include<cstdio> using namespace std; int main() { int n; int ans = 0; int dp[1005]; int num[1005]; scanf("%d",&n); for(int i=0;i<n;i++){ scanf("%d",&num[

小结:动态规划

概要: 状态.转移:最优子结构.无后效性. 技巧及注意: dp就是纯经验+智商题 在dp方程写出来后,一定要考虑边界!不要以为转移对了就行了! 滚动数组的话一定要考虑好顺序! 下标有时候可以灵活使用!比如mod意义下的dp,倍数什么.可到达性等题目都可以这样做. 如果是线性序列的max{f[k]},k<i这种可以用线段树或bit维护成log 注意“前i”和“第i”的区别(特别对于答案更新),有时换一种就能解答出问题. 在状态加限制条件,如单调.地址等. 用下标来维护下标这个答案是否可达. 博弈论

HDU1423 最长公共上升子序列LCIS

Problem Description This is a problem from ZOJ 2432.To make it easyer,you just need output the length of the subsequence. Input Each sequence is described with M - its length (1 <= M <= 500) and M integer numbers Ai (-2^31 <= Ai < 2^31) - the

LIS的三种求解方法

1.  O(n^2) 传统的求解方法 ,思路为dp,状态转移方程为 dp[i]=max( dp[j]+1,1) 即到目前的i为止,对前面出现的a[j](j<i)进行遍历 ,如果出现了a[i]>a[j]的情况 ,就使用状态转移方程. 转移方程代表了两种可能 ,第一种为第i个元素自己成为一个上升的队列  ,或者是由于前面的a[j]<a[i]  所以在 dp[j]的基础之上形成了dp[i] = dp[j]+1  但前提是a[i]>a[j] # include <stdio.h>

ACM入门 训练方法

ppt:http://pan.baidu.com/s/1eQBzFqE 入门知识汇总: 经典DP: LIS LCS, 状态压缩DP 区间DP 图论:MST , 最短路三种算法(dijkstra , bellman ford, floyd ),最大流, 双连通分量(点双连通,边双连通,强连通) 数学:质因数分解,筛素数,数论的常用结论 数据结构: 线段树,树状数组,字典树,kmp,哈希,平衡树(treap 或者 splay) 搜索:普通dfs  bfs , 双向广搜, 常用的剪枝策略. 算法的中英