【算法导论之七】动态规划求解最长公共子序列

一、动态规划的概念

动态规划(Dynamic Programming)是通过组合子问题的解而解决整个问题的。分治算法是指将问题划分成一些独立的子问题,递归地求解各子问题,然后合并子问题的解而得到原始问题的解,与此不同,动态规划适用于子问题不是独立的情况,也就是各个子问题包含公共的子问题。在这种情况下,采用分治法会做许多不必要的工作,即重复地求解公共地子问题。动态规划算法对每个子问题只求解一次,将其结果保存在一张表中,从而避免每次遇到各个子问题时重新计算答案。

动态规划通常应用于最优化问题。此类问题可能有很多种可行解。每个解有一个值,而我们希望找出具有最优(最大或最小)值的解。称这样的解为该问题的“一个”最优解,而不是“确定的”最优解,因为可能存在多个取最优值的解。

为了节约重复求相同子问题的时间,引入一个数组,不管他们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划所采用的基本方法。

二、动态规划求解的一般步骤

动态规划算法的设计可以分为如下4个步骤:

1> 描述最优解的结构。

2> 递归定义最优解的值。

3> 按自底向上的方式计算最优解的值。

4> 由计算出的结果构造一个最优解。

这就是动态规划算法的一般步骤,单这么说肯定没有任何意义,下面我们会通过求解最长公共子序列问题来说明,如何一步步的适用动态规划思想分析问题。

三、最长公共子序列问题描述

问题描述:字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列。令给定的字符序列 X = "x0, x1, ... xm-1",字符序列 Y = "y0, y1, ... , yk-1"是X的子序列,则存在X的一个严格递增(注意:不是连续递增)下标序列<i0, i1, ... , ik-1>,使得对所有的j=1=0, 1, ... , k-1,有xj = yj。例如,X="ABCBDAB", Y="BCDB"是X的一个子序列。

先给出问题:假设字符串X = “ABCBDAB”, Y=“BDCABA”,求他们的最长公共子序列。

四、动态规划求解最长公共子序列问题

1> 描述最优解的结构。

解决上述问题的一种强力方法是枚举出X的所有子序列,然后逐一检查看其是否为Y的子序列,并随时记录所发现的最长子序列。X的每个子序列对应于X的下标集{1,2,... ,m}的一个子集。X共有2^m个子序列,因此这种方法需要指数时间,这对长序列来说是不实际的。

设 X = <x1, x2, ... , xm> 和 Y = <y1, y2, ... , yn>为两个序列,并设Z = <z1, z2, ... , zk>为X和Y的任意一个最长公共子序列。则我们可以得出以下的结论:

1) 如果Xm = Yn,那么zk = Xm = Yn,而且zk-1是Xm-1和Yn-1的一个最长公共子序列。

2) 如果Xm != Yn,那么zk != Xm蕴含Z是Xm-1和Yn的一个最长公共子序列。

3) 如果Xm != Yn,那么zk != Yn蕴含Z是Xm和Yn-1的一个最长公共子序列。

这样,在找X和Y的最长公共子序列时,如果有Xm-1 = Yn-1,则进一步解决一个子问题,找"x0, x1, ... , xm-2" 和 "y0, y1, ... , yn-2"的一个最长公共子序列;如果Xm-1 != Yn-1,则需要解决两个子问题,找出"x0, x1, ... , xm-2" 和 "y0, y1, ... , yn-1"的一个最长公共子序列和找出 "x0, x1, ... , xm-1" 和 “y0, y1, ... , yn-2”的一个最长公共子序列,再去两者中较长者作为X和Y的最长公共子序列。

2> 递归定义最优解的值

最长公共子序列问题的递归解涉及到建立一个最优解的递归式。定义c[i, j]的序列为Xi 和 Yj的一个最长公共子序列的长度。如果i = 0 或 j = 0,其中一个的序列长度为0,因此最长公共子序列的长度为0。由最长公共子序列问题的最优子结构可得递归式

3> 按自底向上的方式计算最优解的值

引入一个二维数组,C[i][j],用C[i][j]记录X[i]与Y[j]的最长公共子序列的长度,B[i][j]记录C[i][j]是通过那一个子问题的值求得的,以决定搜索我们是自底向上进行递推计算,那么在计算c[i,j]之前,c[i-1][j-1],c[i-1][j]与c[i][j-1]均已计算出来。此时我们根据X[i] = Y[j]还是X[i] != Y[j],就可以计算出c[i][j]。

for (int i = 1; i <= nXlen; i++)
	{
		for (int j = 1; j <= nYlen; j++)
		{
			if (strX[i] == strY[j])
			{
				C[i][j] = C[i-1][j-1] + 1;
				B[i][j] = 0;
			}
			else
			{
				//! 注意这里的=号,它表示了,如果C[i-1][j] == C[i][j-1]的时候,它既可以向左走又可以向上走
				//! 而此时选择了向左走,按照此种方式输出最长公共子序列的时候,只能输出一条,需改进!!
				<span style="color:#FF0000;">if (C[i-1][j] >= C[i][j-1])</span>
				{
					C[i][j] = C[i-1][j];
					B[i][j] = 1;   //! 左移
				}
				else
				{
					C[i][j] = C[i][j-1];
					B[i][j] = -1; //! 右移
				}
			}
		}
	}

4> 由计算出的结果构造一个最优解。

void PrintAllCase(int B[][MAX_LEN], const string &strX, int i, int j)
{
	if (i == 0 || j == 0)
	{
		return ;
	}

	if (B[i][j] == 0)
	{
		PrintAllCase(B, strX, i-1, j-1);
		cout << strX[i-1];
	}
	else if (B[i][j] == 1)
	{
		PrintAllCase(B, strX, i-1, j);
	}
	else
	{
		PrintAllCase(B, strX, i, j-1);
	}
}

五、C++实现代码

/************************************************************************/
/* 动态规划求解最长公共子序列                                           */
/************************************************************************/
#include <stdlib.h>
#include <iostream>
#include <string>
using namespace std;

#define  MAX_LEN     100
void LCS(const string &strX, const string &strY, int nXlen, int nYlen, int C[][MAX_LEN], int B[][MAX_LEN])
{
	for (int i = 0; i <= nXlen; i++)
	{
		C[i][0] = 0;
	}

	for (int j = 0 ; j <= nYlen; j++)
	{
		C[0][j] = 0;
	}

	for (int i = 1; i <= nXlen; i++)
	{
		for (int j = 1; j <= nYlen; j++)
		{
			if (strX[i] == strY[j])
			{
				C[i][j] = C[i-1][j-1] + 1;
				B[i][j] = 0;
			}
			else
			{
				//! 注意这里的=号,它表示了,如果C[i-1][j] == C[i][j-1]的时候,它既可以向左走又可以向上走
				//! 而此时选择了向左走,按照此种方式输出最长公共子序列的时候,只能输出一条,需改进!!
				if (C[i-1][j] >= C[i][j-1])
				{
					C[i][j] = C[i-1][j];
					B[i][j] = 1;   //! 左移
				}
				else
				{
					C[i][j] = C[i][j-1];
					B[i][j] = -1; //! 右移
				}
			}
		}
	}
}

void PrintAllCase(int B[][MAX_LEN], const string &strX, int i, int j)
{
	if (i == 0 || j == 0)
	{
		return ;
	}

	if (B[i][j] == 0)
	{
		PrintAllCase(B, strX, i-1, j-1);
		cout << strX[i-1];
	}
	else if (B[i][j] == 1)
	{
		PrintAllCase(B, strX, i-1, j);
	}
	else
	{
		PrintAllCase(B, strX, i, j-1);
	}
}

int main()
{
	string strX = "ABCBDAB";
	string strY = "BDCABA";

	int C[MAX_LEN][MAX_LEN];    //! 记录最长公共子序列的长度
	int B[MAX_LEN][MAX_LEN];    //! 记录最长公共子序列的移动线路

	int nXlen = strX.length();
	int nYlen = strY.length();

	LCS(strX, strY, nXlen, nYlen, C, B);
	cout << "The max length of LCS is " << C[nXlen][nYlen] << endl;

	cout << "The LCS are : ";
	PrintAllCase(B, strX, nXlen, nYlen);

	system("PAUSE");
	return 0;
}

注意:这里的关键是理解二维数组C和B的适用,以及为什么使用。

当前算法实现在输出最长公共子序列的时候只能输出一条,如果需要输出所有的则需要改进。

时间: 2024-08-05 09:17:49

【算法导论之七】动态规划求解最长公共子序列的相关文章

算法导论_动态规划_最长公共子序列

一.动态规划的概念 动态规划(Dynamic Programming)是通过组合子问题的解而解决整个问题的.分治是指将问题划分成一些独立的子问题,递归地求解各子问题,然后合并子问题的解而得到原始问题的解,与此不同,动态规划适用于子问题不是独立的情况,也就是各个子问题包含公共的子问题.在这种情况下,采用分治法会做许多不必要的工作,即重复地求解公共地子问题.动态规划算法对每个子问题只求解一次,将其结果保存在一张表中,从而避免每次遇到各个子问题时重新计算答案. 动态规划通常应用于最优化问题.此类问题可

动态规划求解最长公共子序列

动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题,先求解子问题,然后从这些子问题的解得到原问题的解.与分治法不同的是,适合于用动态规划求解的问题,经分解得到的子问题往往不是互相独立的.若用分治法来解决这类问题,则分解得到的子问题数目太多,以至于最后解决原问题需要耗费指数时间.然而,不同子问题的数目常常只有多项式量级.在用分治法求解时,有些子问题被重复计算了许多次.如果我们能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,这样就可以避免大量的重复计算,从而得到多项式

动态规划求解最长公共子序列问题

LCS是求两个字符串,最长的公共部分,中间可以间隔其他的元素.例如,字符串s1=''mzjawxu'',s2=''xmjyauz'',仔细分析下,大体可以看出最长公共子序列是''mjau'',我们需要一套科学严格的方法来求解.这个问题是DP问题(动态规划问题).动态规划问题:就是当前问题的求解依赖于上一个子问题,上一个子问题又依赖于前一个子问题,子问题无限递归. 记: Xi=﹤x1,?,xi﹥即X序列的前i个字符 (1≤i≤m)(前缀) Yj=﹤y1,?,yj﹥即Y序列的前j个字符 (1≤j≤n

算法导论--动态规划(最长公共子序列)

最长公共子序列问题(LCS) 给定两个序列X=?x1,x2,x3...xm?和Y=?y1,y2,y3...xn?,求X和Y的最长公共子序列. 例如:X=?A,B,C,B,D,A,B?,和Y=?B,D,C,A,B,A?,的最长公共子序列为?B,C,B,A?,长度为4: 对于此问题,可以采用暴力求解的方式来比对,即穷举出X的所有子序列,用每个子序列与y做一 一比较.假如X序列共有m个元素,对每个元素可以决定选或不选,则X的子序列个数共有2m个,可见与长度m呈指数阶,这种方法效率会很低. 动态规划 前

算法——动态规划篇——最长公共子序列

问题描述      最长公共子序列,英文缩写为LCS(Longest Common Subsequence).其定义是,一个序列 S ,如果分别是两个或多个已知序列的子序列,且是所有符合此条件序列中最长的,则 S 称为已知序列的最长公共子序列.       解决最长公共子序列,一种常用的办法,就是穷举法,组合出所有的情况,但是这样对于长序列的情况来说,是非常不实际.. 假设现在有两个序列,x[]={'A','B','C','B','D','A','B'};y[]={'B','D','C','A'

动态规划解决最长公共子序列问题(转)

原文链接 动态规划法 经常会遇到复杂问题不能简单地分解成几个子问题,而会分解出一系列的子问题.简单地采用把大问题分解成子问题,并综合子问题的解导出大问题的解的方法,问题求解耗时会按问题规模呈幂级数增加. 解决思想: 为了节约重复求相同子问题的时间,引入一个数组,不管它们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划法所采用的基本方法. [问题] 求两字符序列的最长公共字符子序列 问题描述:字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后

动态规划解最长公共子序列问题(转)

 动态规划法 经常会遇到复杂问题不能简单地分解成几个子问题,而会分解出一系列的子问题.简单地采用把大问题分解成子问题,并综合子问题的解导出大问题的解的方法,问题求解耗时会按问题规模呈幂级数增加. 为了节约重复求相同子问题的时间,引入一个数组,不管它们是否对最终解有用,把所有子问题的解存于该数组中,这就是动态规划法所采用的基本方法. [问题] 求两字符序列的最长公共字符子序列 问题描述:字符序列的子序列是指从给定字符序列中随意地(不一定连续)去掉若干个字符(可能一个也不去掉)后所形成的字符序列

算法导论--------------LCS问题(最长公共子系列)

1.基本概念 一个给定序列的子序列就是该给定序列中去掉零个或者多个元素的序列.形式化来讲就是:给定一个序列X={x1,x2,--,xm},另外一个序列Z={z1.z2.--,zk},如果存在X的一个严格递增小标序列<i1,i2--,ik>,使得对所有j=1,2,--k,有xij = zj,则Z是X的子序列.例如:Z={B,C,D,B}是X={A,B,C,B,D,A,B}的一个子序列,相应的小标为<2,3,5,7>.从定义可以看出子序列直接的元素不一定是相邻的. 公共子序列:给定两个

[算法]动态规划之最长公共子序列

最长公共子序列 1 #include<stdio.h> 2 #include<stdlib.h> 3 #include<time.h> 4 #include<string.h> 5 6 #define N 5 7 8 int max(int a, int b, int c) { 9 10 int ab = a>b ? a : b; 11 return ab > c ? ab : c; 12 13 } 14 15 void solve(int *a