一 几个概念:
最优化问题:有n个输入,它的解由这n个输入的一个子集组成,这个子集必须满足某些事先给定的条件,这些条件称为约束条件,满足约束条件的解称为问题的可行解。满足约束条件的可行解可能不止一个,为了衡量这些可行解的优劣,事先给出一定的标准,这些标准通常以函数的形式给出,这些标准函数称为目标函数,使目标函数取得极值的可行解成为最优解,这类问题称为最优化问题。
二 最优性原理:
对于一个具有n个输入的最优化问题,其求解的过程往往可以划分为若干个阶段,每一个阶段的决策仅依赖前一阶段的状态,由决策所采取的动作使状态发生转移,成为下一个阶段的依据。从而,一个决策序列在不断变化的状态中产生。这个决策序列产生的过程称为多阶段决策过程。
在每一个阶段的决策中有一个赖以决策的策略或目标,这种策略或目标是由问题的性质和特点所确定,通常以函数的形式表示并具有递推关系,称为动态规划函数。
多阶段决策过程满足最优性原理:无论决策过程的初始状态和初始决策是什么,其余决策必须相对于初始决策所产生的当前状态,构成一个最优决策序列。
如果一个问题满足最优性原理通常称此问题具有最优子结构性质。
三 特征
我们知道动态规划是求解全局最优解的有效方法,一般来说能用动态规划算法求解的问题具有以下两个显著特称:
- 具有最优子结构性质,也就是说可以递归的定义最优解。
- 能够分解为相互重叠的若干自问题。
- 最优解中也包含其子问题的最优解。
四 设计方案
动态规划法设计方案
- 分段:将原问题分解为若干个相互重叠的子问题;
- 分析:分析问题是否满足最优子结构性质,找出动态规划函数递推式;
- 求解:利用递推式自底向上计算,实现动态规划过程。
五 01背包问题
0/1背包问题中,物品i或者被放入背包,或者不被放入背包,设Xi表示物品i装入背包的情况,则当Xi=0时,表示物品i没有被装入背包,Xi=1时,表示物品i被装入背包。根据问题的要求,有如下约束条件和目标函数:
图 1 约束条件
图2 目标函数
01背包的状态转换方程f[i,j]=
Max{ f[i-1,j-Wi]+Pi( j >= Wi ), f[i-1,j] }
f[i,j]表示在前i件物品中选择若干件放在承重为j的背包中,可以取得的最大价值。
Pi表示第i件物品的价值。
决策:为了背包中物品总价值最大化,第i件物品应该放入背包中吗?
六 动态规划法解决方案
有编号分别为a,b,c,d,e的五件物品,它们的重量分别是2,2,6,5,4,它们的价值分别是6,3,5,4,6,现在给你个承重为10的背包,如何让背包里装入的物品具有最大的价值总和
name |
weight |
value |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
a |
2 |
6 |
0 |
6 |
6 |
9 |
9 |
12 |
12 |
15 |
15 |
15 |
b |
2 |
3 |
0 |
3 |
3 |
6 |
6 |
9 |
9 |
9 |
10 |
11 |
c |
6 |
5 |
0 |
0 |
0 |
6 |
6 |
6 |
6 |
6 |
10 |
11 |
d |
5 |
4 |
0 |
0 |
0 |
6 |
6 |
6 |
6 |
6 |
10 |
10 |
e |
4 |
6 |
0 |
0 |
0 |
6 |
6 |
6 |
6 |
6 |
6 |
6 |
表10/1背包问题动态规划法
表1采用自底向上自左向右的方式生成的。
e1表示在背包容量为1的情况下仅仅放入物品e的价值,因容量1<4因此价值为0;依此类推当背包容量为4时,单元格e4的价值为6。容量继续上涨也只能放置e,因此价值持续为6。
d行可参照递推式f[i,j]=
Max{ f[i-1,j-Wi]+Pi( j >= Wi ), f[i-1,j] }如下描述
- i<=5时,d行表格价值与e行相同;
- i>=6时,比如第6行,选取Max{f[1,1]+4,f[1,6]}即Max{e1+4,
e6}=Max{4, 6} = 6;依此类推d9=Max{f[1,4]+4,f[1,59}=10;
依次类推可计算c/b/a的值,然后根据最大价值返算最优路径。
d1表示背包容量为1的情况下放置物品d和e后的价值,因e的重量为4>1,且d的重量为5>1因此价值为0。直至第5列(不包括d5)d行表格的内容与e行相同,
七 程序实现C#
代码段1 测试函数
class MainClass { public static void Main (string[] args) { Obj[] objs = new Obj[4]; objs[0] = new Obj() { Weight = 7, Price = 42 }; objs[1] = new Obj() { Weight = 3, Price = 12 }; objs[2] = new Obj() { Weight = 4, Price = 40 }; objs[3] = new Obj() { Weight = 5, Price = 25 }; Console.WriteLine ("Dynamicprogramming Model:"); dynamicprogramming d = new dynamicprogramming (objs, 10); int price = d.Execute (); d.Printing (price); //Console.Read(); } }
代码段2 实现函数
public class dynamicprogramming { /// <summary> /// 存储动态规划的递推数据 /// m_V[i][j]表示前i个物品放入容量为j的背包获得的最大价值 /// 其中第0行作为初始化,表示不放入物品时的价值; /// 第0列作为初始化,表示容量为0时能放入物品的价值; /// </summary> private int[,] m_V; /// <summary> /// 物品数量 /// </summary> private int m_n; /// <summary> /// 背包容量 /// </summary> private int m_w; public Obj[] objs { get; set; } public dynamicprogramming (Obj[] objs, int w) { if (objs == null) { return; } m_n = objs.Length; this.objs = objs; m_w = w; m_V = new int[m_n + 1, m_w + 1]; for (int i = 0; i < m_w+1; i++) { m_V [0, i] = 0; } for (int i = 0; i < m_n+1; i++) { m_V [i, 0] = 0; } } public int Execute() { for (int r = 1; r <= m_n; r++) { for (int w = 1; w <= m_w; w++) { if (w < objs[r - 1].Weight) { m_V[r, w] = m_V[r - 1, w]; } else { int tmp = m_V [r - 1, w - objs [r - 1].Weight] + objs [r - 1].Price; m_V [r, w] = m_V [r - 1, w] > tmp ? m_V [r - 1, w] : tmp; } } } //求装入背包的物品 int weight = m_w; for (int i = m_n; i > 0; i--) { if (m_V[i, weight] > m_V[i - 1, weight]) { objs [i - 1].Selected = true; weight -= objs [i - 1].Weight; } } return m_V[m_n, m_w]; } public void Printing(int price) { Console.Write("<"); for (int i = 0; i < objs.Length; i++) { Console.Write(objs[i].Selected ? "1 " : "0 "); } Console.WriteLine(">, price: " + price ); } }
输出结果:
注:上述程序使用FreeBSD下Mono开发。
动态规划法-01背包问题