算法重拾之路——最长公共子序列(LCS)

***************************************转载请注明出处:http://blog.csdn.net/lttree********************************************

第二章:动态规划

最长公共子序列

算法描述:

一个给定序列的子序列是该序列中删去若干元素后得到的序列。确切的说,若给定序列 X={ x1,x2,...,xm },则另一序列 Z = { z1,z2, ... ,zk },是X的子序列是指存在一个严格递增下标序列 { i1,i2, ... , ik } 使得对于所有
j = 1,2, ... ,k 有:zj = xij 。 例如,序列 Z = { B,C,D,B } 是序列 X = { A,B,C,B,D,A,B } 的子序列,相应的递增下标序列为 { 2,3,5,7 }。

给定两个序列 X 和 Y,当另一序列Z既是 X的子序列 又是 Y的子序列时,称Z是序列X和Y的 公共子序列。

最长公共子序列问题: 给定两个序列X和Y,找出X和Y的最长公共子序列。

算法分析:

>1< 传统方法

穷举搜索法是最容易想到的算法,对X的所有子序列,检查它是否也是Y的子序列,从而确定它是否为X和Y的公共子序列。并且在检查过程中记录最长的公共子序列。X的所有子序列都检查过后即可求出X和Y的最长公共子序列。X的每个子序列相应于下标集 { 1,2,...,m }的一个子集。因此,共有 2^m 个不同子序列,从而穷举搜索法需要  指数时间。

>2< 动态规划

? 最长公共子序列问题有着最优子结构性质,

设 序列X = { x1,x2,...,xm } 和 Y={ y1,y2,...,yn } 的最长公共子序列为 Z={ z1,z2,...,zk } 则:

(1)若xm=yn,则zk=xm=yn,且zk-1是xm-1和yn-1的最长公共子序列.

(2)若xm!=yn且zk!=xm,则Z是xm-1和Y的最长公共子序列.

(3)若xm!=yn且zk!=yn,则Z是X和yn-1的最长公共子序列.

其中,Xm-1={x1,x2……xm-1},Yn-1={y1,y2……yn-1},Zk-1={z1,z2……zk-1}.

? 最长公共子序列的子问题的递归结构

求两个序列的最长公共子序列,根据最优子结构性质可知,要按这样方式,递归进行:

> 当xm =
yn 时, 找出 Xm-1 和 Yn-1的最长公共子序列,然后在其尾部加上xm(或者yn)即可得
X和Y 的最长公共子序列。

> 当xm ≠
yn 时,必须解两个子问题,即找出 Xm-1 和 Y的一个最长公共子序列 及 X和 Yn-1 的一个最长公共子序列。 这两个公共子序列中较长者即为 X 和 Y 的最长公共子序列。

? 建立的递归关系如下:

算法程序:

<span style="font-family:Comic Sans MS;font-size:12px;">#include <iostream>
using namespace std;
const int M = 7;
const int N = 6;

// 求最长公共子序列函数
void LCSLength( int m , int n ,char* x ,char* y,int** c,int** b)
{
    int i,j;
    // 数组边界设置为0
    for( i = 1 ; i <= m ; ++i ) c[i][0] = 0;
    for( i = 1 ; i <= n ; ++i ) c[0][i] = 0;

    // 挨个比较
    for( i = 1 ; i <= m ; ++i )
        for( j = 1 ; j <= n ; ++j ) {
            // 如果 相应位置 字符相等,则最长子序列在之前的基础上+1,并且b数组存储标记1
            if( x[i] == y[j] )  {
                c[i][j] = c[i-1][j-1] + 1;
                b[i][j] = 1;
            }
            // 如果 相应位置 字符不同,则查询横向和纵向哪个子序列长度最长,并且b数组存储相应标记
            else if( c[i-1][j] >= c[i][j-1] )   {
                c[i][j] = c[i-1][j];
                b[i][j] = 2;
            }
            else    {
                c[i][j] = c[i][j-1];
                b[i][j] = 3;
            }
        }
}

// 输出函数
void output(char *s,int n)
{
    for(int i=1; i<=n; i++)
    {
        cout<<s[i]<<" ";
    }
    cout<<endl;
}

// 输出最长公共子序列函数
void LCS( int i ,int j ,char* x,int** b )
{
    if( i == 0 || j == 0 )  return;
    if( b[i][j] == 1 )  {
        LCS(i-1,j-1,x,b);
        cout<<x[i];
    }
    else if( b[i][j] == 2 )
        LCS(i-1,j,x,b);
    else
        LCS(i,j-1,x,b);
}

int main()
{
    char x[] = {' ','A','B','C','B','D','A','B'};
    char y[] = {' ','B','D','C','A','B','A'};

    int **c = new int *[M+1];
    int **b = new int *[M+1];
    for(int i=0;i<=M;i++)
    {
        c[i] = new int[N+1];
        b[i] = new int[N+1];
    }

    cout<<"序列X:"<<endl;
    output(x,M);
    cout<<"序列Y:"<<endl;
    output(y,N);

    LCSLength(M,N,x,y,c,b);

    cout<<"序列X、Y最长公共子序列长度为:"<<c[M][N]<<endl;
    cout<<"序列X、Y最长公共子序列为:"<<endl;
    LCS(M,N,x,b);
    cout<<endl;
    return 0;
}</span>

程序所构造的数组为:

算法优化:

对于一个具体问题,按照一般的算法设计策略设计出的算法,往往在算法的时间和空间需求上还可以改进。这种改进,通常是利用具体问题的一些特殊性。

例如,在算法LCS_length和LCS中,可进一步将数组b省去。

事实上,数组元素c[i,j]的值仅由c[i-1][j-1],c[i-1][j]和c[i][j-1]三个值之一确定,而数组元素b[i][j]也只是用来指示c[i][j]究竟由哪个值确定。

因此,在算法LCS中,我们可以不借助于数组b而借助于数组c本身临时判断c[i][j]的值是由c[i-1][j-1],c[i-1][j]和c[i][j-1]中哪一个数值元素所确定,代价是Ο(1)时间。

既然b对于算法LCS不是必要的,那么算法LCS_length便不必保存它。这一来,可节省θ(mn)的空间,而LCS_length和LCS所需要的时间分别仍然是Ο(mn)和Ο(m+n)。

另外,如果只需要计算最长公共子序列的长度,则算法的空间需求还可大大减少。事实上,在计算c[i][j]时,只用到数组c的第i行和第i-1行。因此,只要用2行的数组空间就可以计算出最长公共子序列的长度。更进一步的分析还可将空间需求减至min(m, n)。

***************************************转载请注明出处:http://blog.csdn.net/lttree********************************************

时间: 2024-11-08 17:25:48

算法重拾之路——最长公共子序列(LCS)的相关文章

动态规划算法解最长公共子序列LCS问题

第一部分.什么是动态规划算法 ok,咱们先来了解下什么是动态规划算法. 动态规划一般也只能应用于有最优子结构的问题.最优子结构的意思是局部最优解能决定全局最优解(对有些问题这个要求并不能完全满足,故有时需要引入一定的近似).简单地说,问题能够分解成子问题来解决. 动态规划算法分以下4个步骤: 描述最优解的结构 递归定义最优解的值 按自底向上的方式计算最优解的值   //此3步构成动态规划解的基础. 由计算出的结果构造一个最优解.   //此步如果只要求计算最优解的值时,可省略. 好,接下来,咱们

编程算法 - 最长公共子序列(LCS) 代码(C)

最长公共子序列(LCS) 代码(C) 本文地址: http://blog.csdn.net/caroline_wendy 题目: 给定两个字符串s,t, 求出这两个字符串最长的公共子序列的长度. 字符串的子序列并一定要连续, 能够包含间隔. 即最长公共子序列问题(LCS, Longest Common Subsequence) 使用动态规划, 假设字符相等, 两个字符串就依次递增一位, 一直到字符串的结尾. 代码: /* * main.cpp * * Created on: 2014.7.17

POJ 1458 Common Subsequence(最长公共子序列LCS)

POJ1458 Common Subsequence(最长公共子序列LCS) http://poj.org/problem?id=1458 题意: 给你两个字符串, 要你求出两个字符串的最长公共子序列长度. 分析: 本题不用输出子序列,非常easy,直接处理就可以. 首先令dp[i][j]==x表示A串的前i个字符和B串的前j个字符的最长公共子序列长度为x. 初始化: dp全为0. 状态转移: IfA[i]==B[j] then dp[i][j]= dp[i-1][j-1]+1 else dp[

[2016-05-09][51nod][1006 最长公共子序列Lcs]

时间:2016-05-09 21:12:54 星期一 题目编号:[2016-05-09][51nod][1006 最长公共子序列Lcs] 题目大意:[2016-05-09][51nod][1006 最长公共子序列Lcs].md 分析:动态规划 dp[i][j] 表示字符串A以第i个位置 ,字符串B以第j个位置的最长公共子序列的长度 dp[i][j] = dp[i - 1][j - 1] + 1 if a[i] == a[j] else dp[i][j] == max(dp[i - 1][j] ,

1006 最长公共子序列Lcs

1006 最长公共子序列Lcs 基准时间限制:1 秒 空间限制:131072 KB 给出两个字符串A B,求A与B的最长公共子序列(子序列不要求是连续的). 比如两个串为: abcicba abdkscab ab是两个串的子序列,abc也是,abca也是,其中abca是这两个字符串最长的子序列. Input 第1行:字符串A 第2行:字符串B (A,B的长度 <= 1000) Output 输出最长的子序列,如果有多个,随意输出1个. Input示例 abcicba abdkscab Outpu

序列最的问题之最长公共子序列LCS

在程序设计竞赛中,我们时常会遇到序列求最值的问题.在讲今天的问题之前,先小小的说明一下,子序列与子串的问题. 子序列:在原序列中不一定连续: 子串:在原序列中必须连续. 接下来,就开始今天要讲的最长公共子序列LCS(Longest Common Subsequence).对于LCS这一类的问题,一般是相对于两个序列而言,str[]与ch[].先假设str的长度为n,ch的长度为m.假设str[]="ASBDAH",ch[]="SDAAH";其中"SDA&q

51nod 1006 最长公共子序列Lcs(dp+string,无标记数组实现)

1006 最长公共子序列Lcs 基准时间限制:1 秒 空间限制:131072 KB 分值: 0 难度:基础题 收藏 关注 取消关注 给出两个字符串A B,求A与B的最长公共子序列(子序列不要求是连续的). 比如两个串为: abcicba abdkscab ab是两个串的子序列,abc也是,abca也是,其中abca是这两个字符串最长的子序列. Input 第1行:字符串A 第2行:字符串B (A,B的长度 <= 1000) Output 输出最长的子序列,如果有多个,随意输出1个. Input示

求三个字符串的最长公共子序列LCS(A,B,C)

LCS(A,B,C)!=LCS(A,LCS(B,C)) 反例: abcd abcde abced LCS(B,C)求出来可能是abce或者abcd dp[i][j][k]表示A[0...i],B[0...j],C[0...k]的LCS 转移方程: if (a[i]==b[j]&&b[j]==c[k]) dp[i][j][k]=dp[i-1][j-1][k-1]+1; else dp[i][j][k]=max(max(dp[i][j][k], dp[i-1][j][k]), max(dp[i

动态规划-最长公共子序列LCS

0 问题 给定两个字符串,求最长公共子序列LCS. 也就是说两个字符串中都有的部分,或者理解为,两个字符串同时都删除字符串中的某些字符,使得最终的两个字符串,相等,且是最长的. 1 分析 假设两个str1,str2字符串,已经知道了最长公共子序列长度为L 那么,当在str1和str2,两个的尾部,同时添加一个相同的字符,比如a,那么新的str1,和str2的最长公共子序列长度就是L+1 当str1后面添加一个字符,str2不添加,那么最长公共子序列长度为L 反之,str1不添加,str2添加,那