大O和数据的规模

1、O（f(n)）

学术界：O表示算法执行的上界，例如，归并算法的时间复杂度可以是O（nlogn）,同时也是O（n^2）的

业界认为：O表示算法执行的最低上界，归并算法的时间复杂度是O（nlogn）

2、一个时间复杂度问题

一个字符串数组，将一每个字符串进行字母序排序，然后将字符串数组进行字典序排序的时间复杂度

n:数组长度 s:最大的字符串长度

O = s*nlogn （字符串数组排序）+ n* slogs(每个字符串)

3、数据规模 : 1S内可以处理的数据规模

O(N^2) ：10^3~10^4

O(NLOGN) :10^6~10^7

O(n):10^7~10^8

4、空间复杂度：额外开通的数组规模

递归调用是牺牲空间的，系统需要将结果压入栈中，递归深度是多少就占多少空间

5、常见的模板时间复杂度

两个数交换：O(1)

1+2+....+N问题，是一重for循环: O(n)

字符串反转,第一个元素和最后一个元素， for(i = 0; i < n/2; i++)：O（n）

选择排序,双重循环，i递增，j从i+1增：O（n^2）

双重循环：j变化是从1到一个常数：O（n）

二分查找,每次对半的查找，n/2的变化经过多少次变为1：O（nlogn）

整数变为字符串：while里每次s+n%10,n = n/10: O(logn)

两重循环：n* logn

判断素数：

************* 有循环看循环的起始点，终止点和每次变化

6、验证算法时间复杂度：一层数据规模变化for，数据变化2倍，看运行时间变化

O（n）:数据变化2倍，运行时间变化2倍

O（logn）:随着数据规模的增加，运行时间基本不变

O（n^2）:数据变化2倍，运行时间变化4倍

O（nlong）:数据变化2倍，运行时间变化1倍多

logn算法是最优的，数据规模越大，时间几乎没差别

7、递归算法时间复杂度：递归算法时间复杂度不一定是o(nlogn)

典型排序算法是递归算法：快速排序和归并排序以及二分查找的递归实现

7.1递归中只进行一次递归调用

1）递归中只进行一次的递归调用：

o(Logn):递归深度depth*每个递归函数中时间复杂度T = o(depth*T)

2)　1到n的和

3)优化了的求x^n次幂，（只能求n大于0的，计算机在处理基数时会进行舍位操作，所以判断是不是基数）

7.2 递归中多次调用递归，画出递归树

1）

递归深度：2^0 + 2 ^1 + 2 ^2……+2 ^n = 2^(n+1) - 1 = O(2^n) 指数级的

指数的优化：通过剪支、动归为多项式

搜索树

2）merge排序的时间复杂度O（nlogn）

深度：logn

每个节点处理的数据规模是缩小的,每层n个节点，每个节点O（1）

7.3 主定理可查看更复杂的递归时间复杂度

以实现一个动态数组为例子：构造函数

7.4均分复杂度：

7.5防止复杂度震荡：删除数组的时候处理，当容量为当前的四分之一时，数组减小为size的二分之一。防止再次添加元素出现复杂度震荡。

时间： 2024-11-06 14:18:36

大O和数据的规模的相关文章

大v用户数据统计分析

1,统计数据的基本情况,包括微博总数,用户总数,最活跃和最不活跃的用户id #!/bin/sh source_dir=/home/minelab/data/DATA source_file_name=userinfo_00_au_1_out source_file=$source_dir/$source_file_name #source_file=test.src out_dir=/home/minelab/liweibo/daV out_file_name=basic_satic.txt o

JDBC:数据库操作：处理大对象CLOB数据

目标: 了解大对象处理基本原理, 掌握CLOB数据的读,写操作. 可以使用CLOB类处理大文本数据. 大对象处理主要指CLOB和BLOB两种类型字段.可以大量存储文字. 要想在程序中处理这样的大数据操作,则必须使用preparedStatement完成.所有文件内容通过IO流方式从大文本字段中保存和读取. 写入大数据对象: 使用PreparedStatement接口中的方法. void setAsciiStream(int parameterIndex, InputStream x, int l

【数据处理】大库订货数据匹配

select distinct a.商品编码,a.品名,a.规格,a.最终进价大库价格,c.curcsprc 进价,a.最终进价-c.curcsprc 差价,d.qty 西部,e.qty 东部,f.qty 中区from lhdh201408 aleft join lhspm b on a.商品编码=b.pluidleft join 商品码 c on b.barcode=c.bcdleft join (select pluno,sum(qty) qty from xbxs where rq b

清理ms sql server 大日志文件数据

1.手动分离数据库: 2.手动删除日志文件: 3.重新生成日志文件: CREATE DATABASE FMIS0 ON (FILENAME = 'E:\FMIS0_DATA\FMIS0-Date') FOR ATTACH_REBUILD_LOG ;GO 清理ms sql server 大日志文件数据

用jdbc访问大段文本数据

1 package it.cast.jdbc; 2 3 import java.io.BufferedReader; 4 import java.io.BufferedWriter; 5 import java.io.File; 6 import java.io.FileNotFoundException; 7 import java.io.FileReader; 8 import java.io.FileWriter; 9 import java.io.IOException; 10 impo

碰到诡异问题，求助大能解答，关于表单提交大文件无限数据提交问题

服务器环境 php环境出现情况:上传30M文件的时候本地数据一直在提交,观察服务器io 也一直有下载流量.但是就没有个结束,php输出 $_FILES,也不会执行到这行代码,比如我提交30M文件表单提交,但是流量估计超过好几百M也不会停止,反正不人为停止脚步,就是不断在数据交互.请问有大哥碰到这情况吗?是否哪些php配置没配置对大文件上传问题已解决以我测试上传32M文件大小为例 php 运行方式 FPM-FCGI php.ini upload_max_filesize = 64M//上传

hbase首次导入大批次的数据成功！

本次主要是采用hbase自带的importtsv工具来导入.首先要把数据文件上传到hdfs上,然后导入hbase表格.该导入方式只支持.tsv数据文件的导入. 导入流程: 1.下载数据.我们在本文中将使用 “美国国家海洋和大气管理局气候平均值”的公共数据集合.访问http://www1.ncdc.noaa.gov/pub/data/normals/1981-2010/下载. 我们使用在目录 products | hourly 下的小时温度数据(可以在上述链接页面中找到).下载hly-temp-

大快搜索数据爬虫技术实例安装教学篇

大快搜索数据爬虫技术实例安装教学篇爬虫安装前准备工作:大快大数据平台安装完成.zookeeper.redis.elasticsearch.mysql等组件安装启动成功. 1.修改爬虫安装配置文件(最好在线下修改好后再上传平台) 2.修改crawler\dkcrw\jdbc.properties配置文件(只修改图片里的内容其他内容默认即可) Hbase.zookeeper.quorum所填地址应在DKM监控平台查看: Redis相关配置看如下界面: 3.把已修改的crawler\dkcrw\下的

echarts大屏展示数据

1.准备工具 1)echarts 去官网下载镜像 https://www.echartsjs.com/zh/download.html 在终端进行 pip 安装 pip install pyecharts-1.7.1-py3-none-any.whl 安装完成之后,我们测试一下, from pyecharts import Bar 报错了,但是并不是因为我们的安装有问题,而是版本不同的问题造成的 from pyecharts.charts import Bar 这样倒入包就没有问题了用小段代码