最长上升子序列(Longest Increasing Subsquence)是指对一个序列,其中满足i < j < k且a[i] < a[j] < a[k]的最长子序列a[]。比如1 4 2 6 3 7 9,则【1,2,3,7,9】就是它的LIS。
LIS普遍求法为动态规划。有两种算法。
第一种比较好写,复杂度O(n^2)。
设原序列为a[]。所有下标从1开始(即[1,n])。定义dp[i]为以a[i]结尾的最长上升子序列的长度。很容易得到转移方程:dp[i] = max{1, dp[j] + 1} 且 j < i。可以这么更新:
dp[i] = 1;
for (int j = 1; j < i; ++j) {
if (a[j] < a[i]) dp[i] = max(dp[i], dp[j] + 1);
}
这里选取poj2533来说明具体的实现。
#include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int MAX = 1024; const int INF = 0xfffffff; int a[MAX]; int dp[MAX]; /* dp[i]: 以a[i]为结尾的最长上升子序列的长度 */ inline int read() { char ch; while ((ch = getchar()) < '0' || ch > '9'); int x = ch - '0'; while ((ch = getchar()) >= '0' && ch <= '9') { x = (x << 3) + (x << 1) + ch - '0'; } return x; } int main() { int n; while (~scanf(" %d", &n)) { for (int i = 1; i <= n; ++i) { a[i] = read(); } int ans = 0; for (int i = 1; i <= n; ++i) { dp[i] = 1; for (int j = 1; j < i; ++j) { if (a[j] < a[i] && dp[j] + 1 > dp[i]) { dp[i] = dp[j] + 1; } } if (dp[i] > ans) ans = dp[i]; } printf("%d\n", ans); } return 0; }
很多情况下这种解法达不到我们需要的复杂度,因为实际情形下动辄就是几百万的数据量。。。这时就需要改进上述算法
增加数组d[],d[i]记录的是a[]数组中所有使得dp[j]=i的最小值。维护d[]使得d[]满足单调性(因为是上升子序列,这里就是单调增,如果求下降子序列扩展成单调减即可),另外维护一个值maxLen记录最长位置
举例如下(下标从1开始):
对于序列a[] = {1,5,7,2,3,6,8}
初始化d[] = INF.即任意d[i]都等于一个很大的值,避免影响答案。maxLen = 0即可。
但是d[0] = -INF,下面说原因。
第一次:dp[1] = 1(长度为1), maxLen = 1, d[1] = 1(最长上升子序列为1的最小结尾数字是a[1],等于1),剩下的d[i]不变(下同)。此时d[] = {-INF, 1, INF, INF...INF}
第二次:a[2] = 5 > d[maxLen]。则dp[2] = maxLen + 1 = 2 (长度为2),maxLen = 2,d[2] = 5 (最长上升子序列为2的最小结尾数字是5)。d[] = {-INF, 1, 5, INF,...,INF}
第三次:a[3] = 7 > d[maxLen],则dp[3] = maxLen + 1 = 3,maxLen = 3, d[3] = 7。此时d[] = {-INF, 1, 5, 7, INF, INF, INF...}
第四次:a[4] = 2 < d[maxLen],则从d[1]到d[maxLen]中找最后一个比2小的数,找到数字1,下标为ind = 1(d[1] = 1嘛~),dp[4] = dp[ind] + 1 = dp[1] + 1 = 2, maxLen为3不动, d[ind+1] = d[2] = 2。此时d[] = {-INF, 1, 2, 7, INF, INf, INf...}
第五次:a[5] = 3 < d[maxLen],则从d[1]到d[maxLen]找最后一个比3小的数,找到2,下标为ind = 2(d[2] = 2哦),dp[5] = dp[ind] + 1 = dp[2] + 1 = 3, maxLen为3不动,d[ind+1] = d[3] = 3.此时{-INF, 1, 2, 3, INF, INF, INF...}
第六次:a[6] = 6 > d[maxLen],直接dp[6] = maxLen + 1 = 4, maxLen = 4, d[4] = 6.此时d[] = {-INF, 1, 2, 3, 6, INF, INF...}
第七次:a[7] = 8 > d[maxLen], 直接dp[7] = maxLen + 1 = 4, maxLen = 5, d[5] = 8.此时d[] = {-INF, 1, 2, 3, 6, 8, INF, INF...}
上述就是更新过程,为什么d[0]要初始化为一个负无穷(-INF)呢?因为假设a[]都是正整数,之前记录的d[1] = 5.后面出来一个1,显然如果d[0]不是很小,就不好找所谓“比1小的最后一个数”了,没人比它小!!!
不过话说回来,找最后一个比它小的,更新值时又去更新的是后面一个数,那我们还不如找数组{d[1]到d[i]}中第一个比a[i]大的数呢!呵呵,就是这样的!
你不会到现在还没明白为什么要这么更新吧?我们大费周章让d[]单调递增,然后更新时刻意选择d[]中小于a[i]和大于a[i]的”交界点“,其实是为了可以使用二分搜索,从而加速整个算法呀!二分搜索可以达到O(logn)的复杂度,这样一来我们在更新时不需要遍历所有1<=j<i,只需要更新一个点,复杂度不就马上降下来了嘛!
还有,我们最后得到的答案不就是maxLen了嘛?还要dp[]数组作甚?对,如果只需要最长上升子序列的长度,这个dp数组就没用了。。。不过我还是习惯性地保留,万一用上了呢。。。
下面给出poj2533的实现:
#include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int INF = 0xfffffff; const int MAX = 1024; int dp[MAX]; int a[MAX]; int d[MAX]; inline int read() { char ch; while ((ch = getchar()) < '0' || ch > '9'); int x = ch - '0'; while ((ch = getchar()) >= '0' && ch <= '9') { x = (x << 3) + (x << 1) + ch - '0'; } return x; } int main() { int n; while (~scanf(" %d", &n)) { for (int i = 1; i <= n; ++i) { a[i] = read(); //scanf(" %d", a + i); } //初始化 fill(d, d + n + 1, INF); d[0] = -INF; //-INF必须小于所有的a[i],否则可能影响算法,INF必须大于所有a[i] dp[0] = 0;//下面说明初始化原因 int maxLen = 0; for (int i = 1; i <= n; ++i) { if (a[i] > d[maxLen]) { //此时把a[i]加到末尾可以获得更长的子序列 //这里第一次迭代时必须被执行,我们必须保证a[1] > d[0]。这也是初始化d[0]=-INF的原因 maxLen++; dp[i] = maxLen; d[maxLen] = a[i]; } else { int ind = upper_bound(d, d + maxLen + 1, a[i]) - d;//upper_bound找{d[0],..,d[maxLen]}第一个大于a[i]的数,注意下标 d[ind] = a[i]; dp[i] = dp[ind-1] + 1;//试想,这里可能找到ind=1,那么就变成dp[0]+1了, 所以dp[0]初始化为0 } } printf("%d\n", maxLen); } return 0; }
toj4071:
#include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int INF = 0xffffff; const int MAX = 100007; int a[MAX], d[MAX]; struct Node { int x, y; bool operator<(const Node& B)const { return x == B.x ? y < B.y : x < B.x; } } bird[MAX]; inline int read() { char ch; while ((ch = getchar()) < '0' || ch > '9'); int x = ch - '0'; while ((ch = getchar()) >= '0' && ch <= '9') { x = (x << 3) + (x << 1) + ch - '0'; } return x; } int main() { int T, n; T = read(); //scanf(" %d", &T); while (T--) { n = read(); //scanf(" %d", &n); for (int i = 1; i <= n; ++i) { bird[i].x = read(); bird[i].y = read(); //scanf(" %d %d", &bird[i].x, &bird[i].y); } sort(bird + 1, bird + n + 1); for (int i = 1; i <= n; ++i) { a[i] = bird[i].y; } fill(d + 1, d + n + 1, INF); int maxLen = 0, ind; for (int i = 1; i <= n; ++i) { if (a[i] >= d[maxLen]) { ++maxLen; d[maxLen] = a[i]; } else { ind = upper_bound(d + 1, d + maxLen + 1, a[i]) - d; d[ind] = a[i]; } } printf("%d\n", maxLen); } return 0; }