什么是数据结构?
数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
还有一些概念(数据、数据元素、数据项、数据对象、数据类型...)
传统上,我们把数据结构分为逻辑结构和物理结构。
逻辑结构:是指数据对象中数据元素之间的相互关系,也是我们今后最需要关注和讨论的问题。
物理结构:是指数据的逻辑结构在计算机中的存储形式。
逻辑结构分为以下四种:
1.集合:集合结构中的数据元素除了同属于一个集合外,之间没有任何关系。
2.线性结构:元素之间一对一。
3.树形结构:一对多。
4.图形结构:多对多。
物理结构分为以下两种:
1.顺序存储结构:数据元素存放在地址连续的存储单元里,其数据间的逻辑关系与物理关系一致。
2.链式存储结构:数据元素放在任意的存储单元里,可以连续也可以不连续。
谈谈算法
程序=数据结构+算法
算法的五个基本特征:输入、输出、有穷性、确定性和可行性。
<1>算法具有零个或多个输入。
<2>算法至少有一个或多个输出。
<3>指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。
<4>算法的每一个步骤都具有确定的含义,不会出现二义性。
<5>算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成。
设计要求:
<1>正确性
<2>可读性
<3>健壮性
<4>时间效率高
<5>存储量低。
因此在度量过程中产生了两个复杂度,分别为时间复杂度和空间复杂度。
时间复杂度
算法时间复杂度的定义:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。
算法的时间复杂度,也就是算法的时间量度,记作:T(n)= O(f(n))。
它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
一般情况下,随着输入规模n的增大,T(n)增长最慢的算法为最优算法。
计算方法:
<1>用常数1取代运行时间中的所有加法常数。
<2>在修改后的运行次数函数中,只保留最高阶项。
<3>如果最高阶项存在且不是1,则去除与这个项相乘的常数,得到的最后结果就是大O阶。
举例:
(1)
int a = 1; int b = 2; int c = 3;
纯加法常数 执行时间为1+1+1 所以时间复杂度记为O(1)
(2)
int i , n = 100, sum = 0; for( i=0; i < n; i++ ) { sum = sum + i; }
执行时间为 O(1) + O(n) //for会循环执行n次所以时间复杂度为O(n)
(3)
int i, j, n = 100; for( i=0; i < n; i++ ) { for( j=0; j < n; j++ ) { printf(“I love FishC.comn”); } }
外层执行O(n)次,内层执行O(n)因为时间复杂度为O(n^2)
(4)
int i, j, n = 100; for( i=0; i < n; i++ ) { for( j=i; j < n; j++ ) { printf(“I love FishC.comn”); } }
由于当i=0时,内循环执行了n次,当i=1时,内循环则执行n-1次……
当i=n-1时,内循环执行1次,所以总的执行次数应该是:n+(n-1)+(n-2)+…+1 = n(n+1)/2
取最高次幂所以时间复杂度为O(n^2)
(5)
int i = 1, n = 100; while( i < n ) { i = i * 2; }
由于每次i*2之后,就举例n更近一步,假设有x个2相乘后大于或等于n,则会退出循环。
于是由2^x = n得到x = log(2)n,所以这个循环的时间复杂度为O(logn)。
最坏情况与平均情况
我们查找一个有n个随机数字数组中的某个数字,最好的情况是第一个数字就是,
那么算法的时间复杂度为O(1),但也有可能这个数字就在最后一个位置,那么时间复杂度为O(n)。
平均运行时间是期望的运行时间,最坏运行时间是一种保证。
在应用中,这是一种最重要的需求,通常除非特别指定,我们提到的运行时间都是最坏情况的运行时间。
空间复杂度
算法的空间复杂度通知计算方法所需的存储空间实现,算法的空间复杂度的计算公式记作:S(n)=O(f(n))其中,n为问题的规模,f(n)为语句关于n所占存储空间的函数。
参考<<大话数据结构>>