ACM程序设计报告
- -王浩 14级计算机4班
通过十六周的acm程序设计实习,感受颇深,acm不仅仅是对编程能力的锻炼,更是对逻辑思维能力的提升。从第一专题到第四专题,stl,贪心算法,搜索,背包,动态规划,图论,最小生成树等等,这些知识都是之前在各门课中接触到过的,但是在acm中,我对算法有了一个新的认识,也对之前学的知识有了更深入的认识。
对acm的认识是从大一开始的,当时在东校的时候也是到本部参加了一段时间的acm程序设计课,当时接触的东西比较少,而且是光学了C语言,对程序设计的理解非常浅显,平时最常干的事就是做openjudge,后来参加了acm课,讲的堆栈,stl什么的,就感觉非常难于理解,寒假的刷题也没有坚持下来,然后就浑浑噩噩了一段时间,开学就没有继续上课。后台转了专业,又选了acm,才算是开始真正对acm的学习。
然后总结一下一个学期acm的学习吧,以及一些做题的感悟:
stl标准模板库:
STL标准模板库(英文:Standard Template Library,缩写:STL),是一个C++软件库,也是C++标准程序库的一部分。其中包含4个组件,分别为算法、容器、函数、迭代器。这是在维基百科中的解释。当时学习stl的做了一部分笔记,stl在a题的时候用处还是比较多的。简单总结一下吧,stl中有六大容器:
容器(Container),是一种数据结构,如list,vector,和deques
,以模板类的方法提供。为了访问容器中的数据,可以使用由容器类输出的迭代器;
迭代器(Iterator),提供了访问容器中对象的方法。例如,可以使用一对迭代器指定list或vector中的一定范围的对象。迭代器就如同一个指针。事实上,C++的指针也是一种迭代器。但是,迭代器也可以是那些定义了operator*()以及其他类似于指针的操作符地方法的类对象;
算法(Algorithm),是用来操作容器中的数据的模板函数。例如,STL用sort()来对一个vector中的数据进行排序,用find()来搜索一个list中的对象,函数本身与他们操作的数据的结构和类型无关,因此他们可以在从简单数组到高度复杂容器的任何数据结构上使用;
仿函数(Function object,仿函数(functor)又称之为函数对象(function object),其实就是重载了()操作符的struct,没有什么特别的地方
迭代适配器(Adaptor)
空间配制器(allocator)其中主要工作包括两部分1.对象的创建与销毁 2.内存的获取与释放。
讲acm的时候涉及了一些数据结构的知识,就是栈,队列。总体感觉学习acm对于学习数据结构还是很有帮助的。
贪心算法:
后来讲到了贪心算法,贪心算法的思想就是以局部最优找寻全局最优。在a题的时候,贪心算法主要解决了诸如背包价值最大,节目安排时间最优等问题。在贪心算法的设计中,有以下几点注意事项:
(1)候选集合A:为了构造问题的解决方案,有一个候选集合A作为问题的可能解,即问题的最终解均取自于候选集合A。
(2)解集合S:随着贪心选择的进行,解集合S不断扩展,直到构成满足问题的完整解。
(3)解决函数solution:检查解集合S是否构成问题的完整解。
(4)选择函数select:即贪心策略,这是贪心法的关键,它指出哪个候选对象最有希望构成问题的解,选择函数通常和目标函数有关。
(5)可行函数feasible:检查解集合中加入一个候选对象是否可行,即解集合扩展后是否满足约束条件。
当事老师讲课时举了一个十分搞笑的例子,就是往书包里装吃的,印象比较深刻。
接下来讲到了搜索,个人感觉搜索还是很重要的,以及对于深搜与广搜的理解,过几天就要靠数据结构了,趁这个机会着重复习一下。
深度优先搜索(DFS):
基本思想:从初始状态,利用规则生成搜索树下一层任一个结点,检查是否出现目标状态,若未出现,以此状态利用规则生成再下一层任一个结点,再检查,重复过程一直到叶节点(即不能再生成新状态节点),当它仍不是目标状态时,回溯到上一层结果,取另一可能扩展搜索的分支。采用相同办法一直进行下去,直到找到目标状态为止。
在图中,深度优先遍历类似于树的前序遍历。
从图中某顶点v出发进行深度优先遍历的基本思想是:
(1)访问顶点v;
(2)从v的未被访问的邻接顶点选一个顶点w,从w出发进行深度优先遍历
(3)重复上面两步,直到所有的相同的顶点都被访问到。
伪代码是:(1)访问顶点v,visited[v] = 1 //设置顶点已被访问
(2)w=顶点v的第一个邻接点;
(3)while(w存在)
If(w被访问)从顶点w出发递归该算法
Else w=顶点v的下一个邻接点
广度优先算法(BFS):
基本思想:从初始状态s开始,利用规则,生成所有可能的状态。构成下一层的节点,检查是否出现目标G,若未出现,则对该层顶点分别顺序利用规则生成下一层的所有节点,人后判断下一层又没有出现目标节点G,若以让没有出现,则递归调用算法,若已经出现,则程序结束。
在图中广度优先遍历类似于树的层序遍历。
在图中某顶点出发进行广度优先遍历的基本思想是:
(1)访问顶点v
(2)依次访问v的每一个未被访问的邻接顶点v1,v2,v3...,vn;
(3)分别从v1,v2...v k出发依次访问他们未被访问到的邻接点,并使“先被访问顶点的邻接点”先于“后被访问的定点的邻接点”被访问。直至图中的所有与顶点v相连通的顶点都被访问到。
伪代码: (1)初始化队列Q
(2)访问顶点v,visited[i] =1;顶点v入队列q;
(3)while(队列i非空)
V = 队列Q的队头元素出队
W = 顶点v的第一个邻接顶点
While(w存在)
如果w未被访问,则访问顶点w;visited[w] = 1;顶点w入队
W = 顶点v的下一个邻接点;
深度优先搜索与广度优先搜索的区别:
深搜是找到一条路,然后一直向下发展,直至找到对象,或者没有找到,换一条路继续深搜。而广搜则是一种层序遍历,从根节点开始,一层一层的遍历,直到找到对象。总之,一般情况下,深度优先搜索法占内存少但速度较慢,广度优先搜索算法占内存多但速度较快,在距离和深度成正比的情况下能较快地求出最优解。
动态规划:
接下来是动态规划,在做DP专题的题的时候,总是感觉这是纯粹的数学问题,有好多题都是一个简单的递推公式就可以解决的,下面来总结一下吧:
首先,动态规划是解决多阶段决策问题的一种方法。
动态规划的几个概念:
阶段:据空间顺序或时间顺序对问题的求解划分阶段。
状态:描述事物的性质,不同事物有不同的性质,因而用不同的状态来刻画。对问题的求解状态的描述是分阶段的。
决策:根据题意要求,对每个阶段所做出的某种选择性操作。
状态转移方程:用数学公式描述与阶段相关的状态间的演变规律。
动态规划常常适用于有重叠子问题[1]和最优子结构性质的问题,如果不具备这种结构,则不能使用动态规划解决问题。
我感觉,动态规划总的来说就是将一个复杂的大的问题进行分解,分解成一些小的问题景行分别求解,到最后进行用递推解决问题。
老师在讲课的时候说,动态规划是用空间换时间,感觉也是阐述了动态规划的拆分的思想。
背包
接下来是背包问题,之前上课的时候总是会把背包问题和贪心算法联系到一起。
首先,0-1背包:
我对0-1背包就是一个物品,要么放,要么不放。
用子问题定义状态:即f[i][v]表示前i件物品恰放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是:
f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}
这个方程非常重要,基本上所有跟背包相关的问题的方程都是由它衍生出来的。所以有必要将它详细解释一下:“将前i件物品放入容量为v的背包中”这个子问题,若只考虑第i件物品的策略(放或不放),那么就可以转化为一个只牵扯前i-1件物品的问题。如果不放第i件物品,那么问题就转化为“前i-1件物品放入容量为v的背包中”,价值为f[i-1][v];如果放第i件物品,那么问题就转化为“前i-1件物品放入剩下的容量为v-c[i]的背包中”,此时能获得的最大价值就是f[i-1][v-c[i]]再加上通过放入第i件物品获得的价值w[i]。
其次,完全背包:
与0-1背包不同的是,在完全背包中,每种物品都可以使用多次,当然,也可以一次都不使用。
有N种物品和一个容量为V的背包,每种物品都有无限件可用。第i种物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大。
这个问题非常类似于01背包问题,所不同的是每种物品有无限件。也就是从每种物品的角度考虑,与它相关的策略已并非取或不取两种,而是有取0件、取1件、取2件……等很多种。如果仍然按照解01背包时的思路,令f[i][v]表示前i种物品恰放入一个容量为v的背包的最大权值。仍然可以按照每种物品不同的策略写出状态转移方程,像这样:
f[i][v]=max{f[i-1][v-k*c[i]]+k*w[i]|0<=k*c[i]<=v}
这跟01背包问题一样有O(VN)个状态需要求解,但求解每个状态的时间已经不是常数了,求解状态f[i][v]的时间是O(v/c[i]),总的复杂度可以认为是O(V*Σ(V/c[i])),是比较大的。
将01背包问题的基本思路加以改进,得到了这样一个清晰的方法。这说明01背包问题的方程的确是很重要,可以推及其它类型的背包问题。但我们还是试图改进这个复杂度。
最后,是多重背包:
有N种物品和一个容量为V的背包。第i种物品最多有n[i]件可用,每件费用是c[i],价值是w[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大。
这题目和完全背包问题很类似。基本的方程只需将完全背包问题的方程略微一改即可,因为对于第i种物品有n[i]+1种策略:取0件,取1件……取n[i]件。令f[i][v]表示前i种物品恰放入一个容量为v的背包的最大权值,则有状态转移方程:
f[i][v]=max{f[i-1][v-k*c[i]]+k*w[i]|0<=k<=n[i]}
同时,多重背包问题还可以转化成0-1背包做。
背包问题总是理解的不够深入,下学期学算法的时候要重新看一下这一节。
图论
首先图的定义:图论〔Graph Theory〕是数学的一个分支。它以图为研究对象。图论中的图是由若干给定的点及连接两点的线所构成的图形,这种图形通常用来描述某些事物之间的某种特定关系,用点代表事物,用连接两点的线表示相应两个事物间具有这种关系。
最早接触图论是学离散数学的时候,当时记忆最深的是七桥问题,郝建民老师对图论哪一章讲了好久,现在数据结构又学了一遍,感觉理解的还可以了。
讲图之前讲了树,里面的各种概念就不一一赘述了。相比较图来说,树的数据结构比较图来说还是比较简单的。
图中的概念也不一一赘述了,在图论的这一章节,a题的时候感觉主要还是最小生成树问题。最小生成树问题,主要的解决方法有prim算法,kruskal算法,Dijkstra算法等。数据结构中讲了prim算法和kruskal算法,接下来对这几个算法总结一下:
Prim算法:
图论中的一种算法,可在加权连通图里搜索最小生成树。意即由此算法搜索到的边子集所构成的树中,不但包括了连通图里的所有顶点,且其所有边的权值之和亦为最小。
从单一顶点开始,普里姆算法按照以下步骤逐步扩大树中所含顶点的数目,直到遍及连通图的所有顶点。
(1)输入:一个加权连通图,其中顶点集合为V,边集合为E;
(2)初始化:Vnew = {x},其中x为集合V中的任一节点(起始点),Enew
= {};
(3)重复下列操作,直到Vnew = V:
(4)在集合E中选取权值最小的边(u, v),其中u为集合Vnew中的元素,而v则是V中没有加入Vnew的顶点(如果存在有多条满足前述条件即具有相同权值的边,则可任意选取其中之一);
(5)将v加入集合Vnew中,将(u, v)加入集合Enew中;
(6)输出:使用集合Vnew和Enew来描述所得到的最小生成树。
伪代码:
1.初始化:u={v0};te={};
2.重复下述操作,直到u=v;
(1)在e中寻找最短边,且满足u属于v;v属于v-u;
(2)U = u+{v};
(3)Te = te+{(u,v)};
Kruskal算法:
图论中的算法,与prim算法的区别是Kruskal算法是每次查找一个边,而prim算法是每次加一个顶点。
设有一个有n个顶点的连通网N={V,E},最初先构造一个只有n个顶点,没有边的非连通图T={V,
E},图中每个顶点自成一个连通分量。当在E中选到一条具有最小权值的边时,若该边的两个顶点落在不同的连通分量上,则将此边加入到T中;否则将此边舍去,重新选择一条权值最小的边。如此重复下去,直到所有顶点在同一个连通分量上为止。
步骤:
(1)新建图G,G中拥有原图中相同的节点,但没有边
(2)将原图中所有的边按权值从小到大排序
(3)从权值最小的边开始,如果这条边连接的两个节点于图G中不在同一个连通分量中,则添加这条边到图G中
(4)重复3,直至图G中所有的节点都在同一个连通分量中
总之,kruskal算法还是比较容易理解的一种算法。
Dijkstra算法:
是从一个顶点到其余各顶点的最短路径算法,解决的是有向图中最短路径问题。迪杰斯特拉算法主要特点是以起始点为中心向外层层扩展,直到扩展到终点为止。
1.初始化所有结点并将起始点设为标记,进入以下循环
2.在到达某点的最短路径中找最小且未标记的点(可以用一维数组表示)
3.标记找到的点,以此标记点为中间点重新计算所有未标记点的最短路径(更新最短路径表)
4.循环1.2步至n-1次(n为顶点数,若最后还有未被标记的,说明无法到达此点)
这学期对于acm的学习大致就是这几个模块,四个专题的学习还是感觉收获颇深。理解了怎样真正提高算法运算效率,提高算法的整体逻辑,也给这学期的数据结构学习带来了很大的帮助。这个学期学的东西也比较多,课非常多,加上有一些项目要做,acm投入的时间多少有些不足,对acm的认识可能也不是很深刻,希望明年的算法设计与分析课可以投入更多的精力。