DP（动态规划）学习心得

　　　　　　　　　　　　　　动态规划学习心得

　　说实话吧，动态规划（DP）确实是一个比较难的知识点，对于初学者来说，是一个难过的坎（笔者的脸呢？开玩笑。）。动态规划就是我从初学开始遇到的最神奇的解法，它不同于暴力搜索，也不同于一般的贪心，能够以出乎人意料的时间复杂度（近似于O（n^2））解决一些难题，算法远远优于一般的深搜（O（2^n））。不过，动态规划的思维性比较强，必须会设好状态，正确写出状态转移方程，并且能够准确判断有无最优子结构。

　　其实有点像贪心，但是它有局部最优解推导向整体最优解的过程，形象一点说，动态规划的“眼光”比贪心更长远，有一个更新最优解的过程，发现问题了可以“反悔”。它还有一点分治的味道，通过对问题划分各个阶段，对各个阶段分别求解，最后推向整体的过程。与分治法不同的是，适合于用动态规划求解的问题，经分解得到子问题往往不是互相独立的。若用分治法来解这类问题，则分解得到的子问题数目太多，有些子问题被重复计算了很多次。如果我们能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，这样就可以避免大量的重复计算，节省时间。我们可以用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到，只要它被计算过，就将其结果填入表中。这就是动态规划法的基本思路。具体的动态规划算法多种多样，但它们具有相同的填表格式。

　　学习动态规划是一个比较漫长的过程，需要慢慢领悟，去体会动态规划的奥义。显然，多做题，多思考是必需的，坚持下去，慢慢就能学会了。

　　下面详细地描述一下：

　　一.动态规划的表示方法：

　　一般地，动态规划有两种表示方法，分别是：1.递推　　2.记忆化搜索。

　　这两种方法各有优缺点，递推的效率更高，可以降维节省空间，能使用滚动数组，但思维性强，难度高。而记忆化搜索更好写，更便于理解，不容易出错，但容易超空间。有时候状态数目多，记忆化搜索就不行了，会超空间。但是递推是绝对没有问题的，只要会滚动数组或者降维。所以，我比较推荐递推的方法，更能够锻炼我们的算法能力。所以我们一般用递推的方法解决动态规划的问题。

　　例如：下面的代码就是一种递推：

f[i][j]=max(f[i+1][j],f[i+1][j+1])+a[i][j];

　　　至于记忆化搜索，也上一波代码：

int dfs(int k,int j)
{
	if(f[k][j]) return f[k][j];
	if(k == n) return a[k][j];
	temp1 = dfs(k+1 , j);
	temp2 = dfs(k+1 , j+1);
	f[k][j] = max(temp1 , temp2)+a[k][j];
}

　　（以上代码以题目数字三角形为例）。

　　二.动态规划的条件：

　　动态规划有两个必要条件：

　　1.无后效性.

　　2.最优子结构.

　　无后效性：

　　标准定义是这样的：将各阶段按照一定的次序排列好之后，对于某个给定的阶段状态，它以前各阶段的状态无法直接影响它未来的决策，而只能通过当前的这个状态。换句话说，每个状态都是过去历史的一个完整总结。这就是无后向性，又称为无后效性。

　　最优子结构：

　　标准定义是这样的:一个最优化策略具有这样的性质，不论过去状态和决策如何，对前面的决策所形成的状态而言，余下的诸决策必须构成最优策略。简而言之，一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。

　　三.动态规划的分类及解决过程：

　 分类：

　　动态规划分为：

　　1.基本线性动规：　比较基础的DP入门

　　2.背包动规　　背包问题，见某大佬著作《背包九讲》

　　3.区间动规　　区间型的动态规划

　　4.双进程动规　　分为两个进程，一般只需要增加一个维度表示状态就可以了。

　　5.树状动规　　在树上做动态规划，较为高级。

　　6.各种优化...............等等

　　解决过程：

　　第一步：读懂题意，看看题目是否可以满足动态规划的条件（及是否可以用动态规划解决）。

　　第二步：根据题目所给的条件划分阶段，可以是题目给定的顺序，或者是贪心的顺序，或者是特殊的顺序。

　　第三步：根据阶段设置状态，一般用f数组表示，最基本规则：求什么设什么，必须满足无后效性。当感觉是dp，但是当前状态不满足必要条件的时候，状态+维。

　　第四步：推出状态转移方程式，能够表示当前最优值和前面最优值的关系。

　　第五步：代码实现，检查前面的步骤是否正确。　　

　　四.动态规划经典例题详解：

　　1.基本线性动规：

　　　　hloj#402护卫队

　　　　　见链接：https://www.cnblogs.com/smilke/p/10502784.html（本蒟蒻的一篇博客题解，如有不当之处欢迎指出）

　　2.背包动规：　　　　　　　　　　　　　　　　　　　　　

　　　　　　　　　　　　　　　　【背包】采药

题目描述

宁智贤是个天资聪颖的孩子，他的梦想是成为世界上最伟大的医师。为此，他想拜附近最有威望的医师为师。

医师为了判断他的资质，给他出了一个难题。

医师把他带到一个到处都是草药的山洞里对他说：“孩子，这个山洞里有一些不同的草药，采每一株都需要一些时间，每一株也有它自身的价值。我会给你一段时间，在这段时间里，你可以采到一些草药。

如果你是一个聪明的孩子，你应该可以让采到的草药的总价值最大。”

　　如果你是宁智贤，你能完成这个任务吗？

输入格式

输入的第一行有两个整数T（1 <= T <= 1000）和M（1 <= M <= 100），用一个空格隔开，T代表总共能够用来采药的时间，M代表山洞里的草药的数目。接下来的M行每行包括两个在1到100之间（包括1和100）的整数，分别表示采摘某株草药的时间和这株草药的价值。

输出格式

输出包括一行，这一行只包含一个整数，表示在规定的时间内，可以采到的草药的最大总价值。

样例数据

input

output

数据规模与约定

时间限制：1s

空间限制：256MB

----------------------------------------我是美美的分割线-------------------------------------------------------

　　这道题就是最基本的01背包，对于每件物品，我们有取和不取两种选择.

　　首先定义状态f[i][j]以j为容量为放入前i个物品(按i从小到大的顺序)的最大价值，那么i=1的时候，放入的是物品1，这时候肯定是最优的.

　　由此，我们推出状态转移方程:f[i][j] = max(f[i-1][j-w[i]])+v[i]，f[i-1][j])；

　　其实，这道题还有一个滚动数组优化，可以优化第一维的空间。

　　优化后的状态转移方程：f[j]=max(f[j-w[i]]+v[i],f[j])；

下面是代码：

#include<bits/stdc++.h>
using namespace std;
int t,m;
int w[100010],v[100010];
int f[100010];
int main()
{
    freopen("input.in","r",stdin);
    freopen("output.out","w",stdout);
    cin>>m>>t;
    for(int i=1;i<=t;i++)
        cin>>w[i]>>v[i];
    for(int i=1;i<=m;i++)
        for(int j=m;j>=w[i];j--)
            {
                f[j]=max(f[j],f[j-w[i]]+v[i]);
            }
    cout<<f[m];
    return 0;
}

　　3.区间动规：

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　【区间动规】石子合并

题目描述

在操场上沿一直线排列着n堆石子。现要将石子有次序地合并成一堆。

规定每次只能选相邻的两堆石子合并成新的一堆，并将新的一堆石子数计为该次合并的得分。

我们希望这n−1次合并后得到的得分总和最小。

输入格式

第一行有一个正整数n（n<=300)，表示石子的堆数；第二行有n个正整数，表示每一堆石子的石子数，每两个数之间用一个空格隔开。它们都不大于10000。

输出格式

一行，一个整数，表示答案。

样例数据

input

3
1 2 9

output

数据规模与约定

区间dp第一题

时间限制：1s

空间限制：256MB

--------------------------------------------我是华丽的分割线-----------------------------------------------------

　　这样我们可以定义状态f[i][j]，表示i到j合并后的最大得分。其中1<=i<=j<=N。

　　既然这样，我们就需要将这一圈石子分割。很显然，我们需要枚举一个k，来作为这一圈石子的分割线。

　　这样我们就能得到状态转移方程：

　　f[i][j] = max(f[i][k] + f[k+1][j] + d(i,j));

　　其中，1<=i<=<=k<j<=N。d(i,j)表示从i到j石子个数的和。

　　下面是代码：

#include<bits/stdc++.h>

#define din(a) (scanf("%d",&a));
#define dout(a) (printf("%d\n",a));
#define ll long long

using namespace std;
int m,k;
int n;
int a[101000];
int f[1001][1001];
int sumn[1001];
int cost[1001][1001];
void work_cost()//计算合并的代价/得分.
{
    for(int i=1;i<=n;i++)
        for(int j=i;j<=n;j++)
            cost[i][j]=sumn[j]-sumn[i-1];
}
void init()
{
    din(n);//初始化
    memset(f,0,sizeof(f));
    memset(sumn,0,sizeof(sumn));
    sumn[0]=0;//计算石子总数，方便累加得分.
    for(int i=1;i<=n;i++){
        din(a[i]);
        sumn[i]=sumn[i-1]+a[i];
    }
    work_cost();
}
void work() //区间动规
{
    for(int p=1;p<=n;p++)
        for(int i=1;i<=n;i++){
            int j=i+p-1;
            if(j>n) break;
            for(int k=i;k<j;k++)
                if((f[i][j]>f[i][k]+f[k+1][j]+cost[i][j]||(f[i][j]==0)))
                    f[i][j]=f[i][k]+f[k+1][j]+cost[i][j];
        }
}
int main()
{
    freopen("Stone.in","r",stdin);
    freopen("Stone.out","w",stdout);
    init();
    work();
    dout(f[1][n]);
    return 0;
}

　　4.双进程DP

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　构建双塔

题目描述

　　2001年9月11日，一场突发的灾难将纽约世界贸易中心大厦夷为平地，Mr. F曾亲眼目睹了这次灾难。为了纪念“911”事件，Mr. F决定自己用水晶来搭建一座双塔。

　　Mr. F有N块水晶，每块水晶有一个高度，他想用这N块水晶搭建两座有同样高度的塔，使他们成为一座双塔，Mr. F可以从这N块水晶中任取M（1≤M≤N）块来搭建。但是他不知道能否使两座塔有同样的高度，也不知道如果能搭建成一座双塔，这座双塔的最大高度是多少。所以他来请你帮忙。

　　给定水晶的数量NN（1≤N≤100）和每块水晶的高度Hi（N块水晶高度的总和不超过2000），你的任务是判断Mr. F能否用这些水晶搭建成一座双塔（两座塔有同样的高度），如果能，则输出所能搭建的双塔的最大高度，否则输出“ImpossibleImpossible”。

输入格式

输入的第一行为一个数N，表示水晶的数量。

第二行为N个数，第i个数表示第i个水晶的高度。

输出格式

　输出仅包含一行，如果能搭成一座双塔，则输出双塔的最大高度，否则输出一个字符串“Impossible”。

样例数据

input

5
1 3 4 5 2

output

数据规模与约定

时间限制：1s

空间限制：256MB

-------------------我还是华丽的分割线-------------------------------

水晶放置在任意一座塔上都会对另一座塔产生影响，故属于双进程问题。

f[i][j]表示取前i块水晶、两塔差为j时较高塔的最大高度。

注意，这里的f[i][j]都是从上一阶段推得的。我们在面对第i块水晶时，它可能是从以下四种决策得来的：

f[i][j]=max(f[i−1][j])f[i][j]=max(f[i−1][j]) . 这块水晶被丢掉了。

f[i][j]=max(f[i−1][j+h[i]])f[i][j]=max(f[i−1][j+h[i]]) . 这块水晶被给了上一个状态中较低的那座塔，且它未超过较高的塔，由图可知较高塔的最大高度是不变的。

f[i[][j]=max(f[i−1][j−h[i]]+h[i])f[i[][j]=max(f[i−1][j−h[i]]+h[i]) .这块水晶被给了上一个状态中较高的塔，由图可知，较高塔的值增加了h[i]h[i]。

当然，此时我们要保证j>h[i]j>h[i]。f[i][j]=max(f[i−1][h[i]−j]+j)f[i][j]=max(f[i−1][h[i]−j]+j) .这块水晶被给了上一阶段较低的塔，且它超过了较高塔。由图可知，较高塔的值增加了jj。

（感谢hh大佬提供思路）。

以下为代码：

#include<bits/stdc++.h>
using namespace std;
int h[10010];
int f[1010][1010];
int n,sum=0;
int main()
{
    freopen("input.in","r",stdin);
    freopen("output.out","w",stdout);
    memset(f,-10,sizeof(f));
    f[0][0]=0;
    scanf("%d",&n);
    for(int i=1;i<=n;i++)
    {
        scanf("%d",&h[i]);
        sum+=h[i];
    }
    for(int i=1;i<=n;i++)
        for(int j=0;j<=sum;j++)//f[i][j]表示前i个水晶选择完后，落差为j时的最优值
        {
            f[i][j]=max(f[i-1][j],f[i-1][j+h[i]]);//不要水晶和要水晶的最优。
            if(j>=h[i]) f[i][j]=max(f[i-1][j-h[i]]+h[i],f[i][j]);
            else
                f[i][j]=max(f[i-1][h[i]-j]+j,f[i][j]);//状态转移
        }
    if(f[n][0]) printf("%d\n",f[n][0]);
    else
        printf("Impossible");
    return 0;
}

　　5.树形动规

　　　　　　　　　　　　　　　　　　树形DP例题1

题目描述

给定一棵n个点的无权树，问树中每个节点的深度和每个子树的大小? （以1号点为根节且深度为0）

输入格式

第1行：n。

第2~n行：每行两个数x,y，表示x,y之间有一条边。

输出格式

n行，每行输出格式为：#节点编号 deep：深度 count：子树节点数（详见样例）

样例数据

input

output

#1 deep:0 count:7
#2 deep:1 count:4
#3 deep:2 count:3
#4 deep:1 count:1
#5 deep:3 count:1
#6 deep:1 count:1
#7 deep:3 count:1

数据规模与约定

15% n<=10;

40% n<=1000;

100% n<=100000;

------------------------------我又是美美的分割线-------------------------------

　　基本的树形，建立一个领接表就OK了。

　　话不多说，直接上代码：

#include<bits/stdc++.h>
using namespace std;
int n,p;
int head[1001000],size[1001000],dep[1001000];
int cnt=0;
int x,y;
struct node
{
    int to,next;
}e[1001000];
void add(int x,int y)
{
    cnt++;
    e[cnt].to=y;
    e[cnt].next=head[x];
    head[x]=cnt;
}
void dfs(int x,int fa,int depth)
{
    size[x]=1;
    dep[x]=depth;
    for(int i=head[x];i;i=e[i].next)
    {
        int v=e[i].to;
        if(v==fa) continue;
        dfs(v,x,depth+1);
        size[x]+=size[v];
    }
}
int main()
{
    freopen("tree.in","r",stdin);
    freopen("tree.out","w",stdout);
    memset(dep,0,sizeof(dep));
    scanf("%d",&n);
    for(int i=1;i<=n-1;i++)
    {
        scanf("%d%d",&x,&y);
        add(x,y);
        add(y,x);
    }
    dfs(1,0,0);
    for(int i=1;i<=n;i++)
    {
        printf("#%d deep:%d count:%d\n",i,dep[i],size[i]);
    }
    return 0;
}

　　五.动态规划的意义：

　　动态规划程序设计是对解最优化问题的一种途径、一种方法，而不是一种特殊算法。不像搜索或数值计算那样，具有一个标准的数学表达式和明确清晰的解题方法。动态规划程序设计往往是针对一种最优化问题，由于各种问题的性质不同，确定最优解的条件也互不相同，因而动态规划的设计方法对不同的问题，有各具特色的解题方法，而不存在一种万能的动态规划算法，可以解决各类最优化问题。因此读者在学习时，除了要对基本概念和方法正确理解外，必须具体问题具体分析处理，以丰富的想象力去建立模型，用创造性的技巧去求解。我们也可以通过对若干有代表性的问题的动态规划算法进行分析、讨论，逐渐学会并掌握这一设计方法。

好好理解动态规划吧！

原文地址：https://www.cnblogs.com/smilke/p/10679345.html

时间： 2024-12-14 11:37:55

DP（动态规划）学习心得

题目描述

输入格式

输出格式

样例数据

数据规模与约定

题目描述

输入格式

输出格式

样例数据

数据规模与约定

题目描述

输入格式

输出格式

样例数据

数据规模与约定

题目描述

输入格式

输出格式

样例数据

数据规模与约定

DP（动态规划）学习心得的相关文章

ACM 学习心得

（转）dp动态规划分类详解

Linux系统理解以及Linux系统学习心得

我的MYSQL学习心得（八）

我的MYSQL学习心得（一）

在马哥linux运维学院学习心得

第一篇大数据学习心得

spring核心知识（学习心得）

C++用法的学习心得