数据结构基础 算法复杂度分析(一) 概念篇

为什么要进行算法分析?

  • 预测算法所需的资源
    • 计算时间(CPU 消耗)
    • 内存空间(RAM 消耗)
    • 通信时间(带宽消耗)
  • 预测算法的运行时间
    • 在给定输入规模时,所执行的基本操作数量,或者称为算法复杂度(Algorithm Complexity)

如何衡量算法复杂度?

  • 内存(Memory)
  • 时间(Time)
  • 指令的数量(Number of Steps)
  • 特定操作的数量
    • 磁盘访问数量
    • 网络包数量
  • 渐进复杂度(Asymptotic Complexity)

算法的运行时间与什么相关?

  • 取决于输入的数据。(例如:如果数据已经是排好序的,时间消耗可能会减少。)
  • 取决于输入数据的规模。(例如:6 和 6 * 109)
  • 取决于运行时间的上限。(因为运行时间的上限是对使用者的承诺。)

算法分析的种类

  • 最坏情况(Worst Case):任意输入规模的最大运行时间。(Usually)
  • 平均情况(Average Case):任意输入规模的期待运行时间。(Sometimes)
  • 最佳情况(Best Case):通常最佳情况不会出现。(Bogus)

在一个长度为 n 的列表中顺序搜索指定的值,则

最坏情况:n 次比较;

平均情况:n/2 次比较;

最佳情况:1 次比较;

而实际中,我们一般仅考量算法在最坏情况下的运行情况,也就是对于规模为 n 的任何输入,算法的最长运行时间。这样做的理由是:

  • 一个算法的最坏情况运行时间是在任何输入下运行时间的一个上界(Upper Bound)。
  • 对于某些算法,最坏情况出现的较为频繁。
  • 大体上看,平均情况通常与最坏情况一样差。

算法分析要保持大局观(Big Idea),其基本思路

  • 忽略掉那些依赖于机器的常量。
  • 关注运行时间的增长趋势。

比如:T(n) = 73n3 + 29n3 + 8888 的趋势就相当于 T(n) = Θ(n3)。

渐近记号(Asymptotic Notation)通常有 O、 Θ 和 Ω 记号法。Θ 记号渐进地给出了一个函数的上界和下界,当只有渐近上界时使用 O 记号,当只有渐近下界时使用 Ω 记号。尽管技术上 Θ 记号较为准确,但通常仍然使用 O 记号表示。

使用 O 记号法(Big O Notation)表示最坏运行情况的上界。例如,线性复杂度 O(n) 表示每个元素都要被处理一次;平方复杂度 O(n^2) 表示每个元素都要被处理 n 次。

例如:

T(n) = O(n3) 等同于 T(n) ∈ O(n3)

T(n) = Θ(n3) 等同于 T(n) ∈ Θ(n3).

相当于:

T(n) 的渐近增长不快于 n3。

T(n) 的渐近增长与 n3 一样快。

  • 注1:快速的数学回忆,loga(b) = y 其实就是 a^y = b。所以,log2^4 = 2,因为 2^2 = 4。同样 log2(8) = 3,因为 2^3 = 8。我们说,log2(n) 的增长速度要慢于 n,因为当 n = 8 时,log2(n) = 3。
  • 注2:通常将以 10 为底的对数叫做常用对数。为了简便,N 的常用对数 log10(N) 简写做 lg N,例如 log10(5) 记做 lg 5。
  • 注3:通常将以无理数 e 为底的对数叫做自然对数。为了方便,N 的自然对数 loge(N) 简写做 ln N,例如 loge(3) 记做 ln 3。
  • 注4:在算法导论中,采用记号 lg n = log2(n) ,也就是以 2 为底的对数。改变一个对数的底只是把对数的值改变了一个常数倍,所以当不在意这些常数因子时,我们将经常采用 "lg n"记号,就像使用 O 记号一样。计算机工作者常常认为对数的底取
    2 最自然,因为很多算法和数据结构都涉及到对问题进行二分。

而通常时间复杂度与运行时间有一些常见的比例关系

计算代码块的渐进运行时间的方法有如下步骤

  • 确定决定算法运行时间的组成步骤。
  • 找到执行该步骤的代码,标记为 1。
  • 查看标记为 1 的代码的下一行代码。如果下一行代码是一个循环,则将标记 1 修改为 1 倍于循环的次数 1 * n。如果包含多个嵌套的循环,则将继续计算倍数,例如 1 * n * m。
  • 找到标记到的最大的值,就是运行时间的最大值,即算法复杂度描述的上界。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-08-06 03:45:43

数据结构基础 算法复杂度分析(一) 概念篇的相关文章

数据结构基础 算法复杂度分析(二) 典例篇

示例代码(1) decimal Factorial(int n) { if (n == 0) return 1; else return n * Factorial(n - 1); } [分析] 阶乘(factorial),给定规模 n,算法基本步骤执行的数量为 n,所以算法复杂度为 O(n). 示例代码(2) int FindMaxElement(int[] array) { int max = array[0]; for (int i = 0; i < array.Length; i++)

数据结构与算法复杂度分析

一.大 O 复杂度表示法 算法的执行效率,粗略地讲,就是算法代码执行的时间.但是,如何在不运行代码的情况下,用“肉眼”得到一段代码的执行时间呢?这里有段非常简单的代码,求 1,2,3…n 的累加和.现在,来估算一下这段代码的执行时间. 1 int cal(int n) { 2 int sum = 0; 3 int i = 1; 4 for (; i <= n; ++i) { 5 sum = sum + i; 6 } 7 return sum; 8 } 从 CPU 的角度来看,这段代码的每一行都执

学好数据结构和算法 —— 复杂度分析

复杂度也称为渐进复杂度,包括渐进时间复杂度和渐进空间复杂度,描述算法随数据规模变化而逐渐变化的趋势.复杂度分析是评估算法好坏的基础理论方法,所以掌握好复杂度分析方法是很有必要的. 时间复杂度 首先,学习数据结构是为了解决“快”和“省”的问题,那么如何去评估算法的速度快和省空间呢?这就需要掌握时间和空间复杂度分析.同一段代码运行在不同环境.不同配置机器.处理不同量级数据…效率肯定不会相同.时间复杂度和空间复杂度是不运行代码,从理论上粗略估计算法执行效率的方法.时间复杂度一般用O来表示,如下例子:计

转 算法复杂度分析

转自 http://www.cnblogs.com/gaochundong/p/complexity_of_algorithms.html 为什么要进行算法分析? 预测算法所需的资源 计算时间(CPU 消耗) 内存空间(RAM 消耗) 通信时间(带宽消耗) 预测算法的运行时间 在给定输入规模时,所执行的基本操作数量. 或者称为算法复杂度(Algorithm Complexity) 如何衡量算法复杂度? 内存(Memory) 时间(Time) 指令的数量(Number of Steps) 特定操作

python数据结构与算法 36 树的基本概念

树 学习目标 理解什么是树及使用方法 学会使用树实现映射 用列表实现树 用类和引用实现树 用递归实现树 用堆实现优先队列 树的例子 前面我们学习过栈和队列这类线性数据结构,并且体验过递归,现在我们学习另一种通用数据结构,叫做树.树在计算机科学中应用广泛,象操作系统.图形学.数据库系统.网络等都要用到树.树和他们在自然界中的表哥--植物树--非常相似,树也有根,有分枝,有叶子.不同之处是,数据结构的树,根在顶上,而叶子在底部. 在开始学习之前,我们来研究几个普通的例子.第一个是生物学上的分级树.图

算法9-4:最大流算法复杂度分析

前面一节介绍了Ford-Fulkerson算法.那么这个算法是否一定能够在有限步骤内结束?要多少步骤呢? 这个问题的答案是,该算法确实能够在有限步骤之内结束,但是至于需要多少步骤,就要仔细分析. 为了分析问题,需要假定图中所有边的容量都是整数.但是有个严重的问题,比如下图中,如果使用Ford-Fulkerson算法,需要迭代200次才能结束. 首先将所有边的容量都初始化为0. 第一次迭代和第二次迭代之后,两条边各增加了1. 到最后200次迭代之后整个算法才结束. 这还不算最坏的情况.因为整数最多

数据结构算法——算法复杂度分析

算法复杂度分为时间复杂度和空间复杂度 首先要清楚一点,大O表示法的时间复杂度高不代表程序运行时间长,空间复杂度高不代表占用空间多. 他们表示的是代码执行时间随着数据规模增长的变化趋势.和算法储存空间与数据规模之间的增长关系. 时间复杂度判断方法 1.只关注循环次数最多的一段代码 2.加法法则:总复杂度等于量级最大的那段代码的复杂度 3.乘法原则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积 常见的复杂度量级(按数量级递增) 常量阶:O(1) 对数阶:O(logn) 线性阶:O(n) 线性对数阶:

Java数据结构之算法时间度

1.度量一个程序(算法)执行时间的两种方法 1)事后统计的方法 这种方法可行, 但是有两个问题:一是要想对设计的算法的运行性能进行评测,需要实际运行该程序:二是所得时间的统计量依赖于计算机的硬件.软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快. 2)事前估算的方法 通过分析某个算法的时间复杂度来判断哪个算法更优. 2.时间频度 基本介绍:一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多.一个算法中的语句执行次数称为

算法复杂度分析方法以及算法概述

算法定义:解决特定问题的求解步骤的描述. 算法特性:有穷性.确定性.可行性.输入.输出 算法的设计要求:正确性.可读性.健壮性.高效率和低存储量需求 算法度量方法:事后统计方法(不科学).事前分析估算方法 函数的渐近增长:给定两个函数f(n)和g(n),如果存在一个整数N,使得对于所有的n>N,f(n)总是比g(n)大,那么我们说f(n)的增长渐近快于g(n). 于是,可以得出结论:判定一个算法好不好,可以对比算法的关键执行次数函数的渐近增长性,基本就可以分析出:某一个算法,随着n的变大,它会越