数据分析(Numpy基础)

数据分析(Numpy基础)

1.什么是数据分析?

数据分析是指,用适当的统计分析方法,对收集来的大量数据进行分析,提取有用信息并形成结论,从而实现对数据的详细研究和概括总结的过程。

2.python做数据分析的常用库

1. numpy        基础数值算法
2. scipy        科学计算
3. matplotlib   数据可视化
4. pandas       序列高级函数

一、numpy概述

1.什么是numpy?

1. Numerical Python,数字的Python,弥补了Python语言所欠缺的数值计算能力。
2. Numpy是其它数据分析及机器学习库的底层库。
3. Numpy完全标准C语言实现,运行效率充分优化。
4. Numpy开源免费。

2.numpy发展历史

1. 1995年,Numeric,Python语言数值计算扩充。
2. 2001年,Scipy->Numarray,多维数组运算。
3. 2005年,Numeric+Numarray->Numpy。
4. 2006年,Numpy脱离Scipy成为独立的项目。

3.numpy的性能

1. 代码简洁:减少Python代码中的循环。
2. 底层实现:厚内核(C)+薄接口(Python),保证性能。

二、numpy基础

1.ndarray数组

1.Numpy中的数组是numpy.ndarray类实例化的对象,其中包括:

元数据(metadata):存储对目标数组的描述信息,如:shape、dtype、size、data等,

实际数据:完整的数组数据

将实际数据与元数据分开存放,一方面提高了内存空间的使用效率,另一方面大部分对数组的操作仅仅是对元数据的操作,从而减少对实际数据的访问频率,提高性能。

2.ndarray数组的特点:

1. Numpy数组是同质数组,即所有元素的数据类型必须相同

2. Numpy数组的下标从0开始,最后一个元素的下标为数组长度减1

 1 import numpy
 2
 3 #numpy.ndarray类的对象表示数组
 4 ary=numpy.array([1,2,3,4,5,6])
 5 print(ary,type(ary)) #[1 2 3 4 5 6] <class ‘numpy.ndarray‘>
 6
 7 #ndarray的运算规则:数组一个矩阵
 8 ary=ary+10
 9 print(ary) #[11 12 13 14 15 16]
10
11 ary=ary+ary  #个数对应才能运算
12 print(ary)#[22 24 26 28 30 32]
13
14 ary=ary>30  #比较运算
15 print(ary) #[False False False False False  True]

2.数组的4种创建方式

(1)numpy.array(任何可被解释为Numpy数组的逻辑结构)

(2)numpy.arange(起始值(0),终止值,步长(1))

(3)numpy.zeros(数组元素个数, dtype=‘类型‘)

(4)numpy.ones(数组元素个数, dtype=‘类型‘)

 1 import numpy
 2
 3 #1.numpy.array()
 4 a1=numpy.array([[1,2,3],[4,5,6]])
 5 print(a1,type(a1))  #[[1 2 3][4 5 6]]
 6
 7 #2.numpy.arange()
 8 a2=numpy.arange(0,10,2)
 9 print(a2,type(a2))  #[0 2 4 6 8]
10
11 #3.numpy.zeros()
12 a3=numpy.zeros((10,),dtype=‘float32‘)
13 print(a3,type(a3))  #[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
14
15 #4.numpy.ones()
16 a4=numpy.ones((2,3),dtype=‘int32‘)
17 print(a4,type(a4))  #[[1 1 1][1 1 1]]
18
19 #numpy.ones_like()  numpy.zeros_like()
20 #构建一个结构与a1相同的全1数组
21 print(numpy.ones_like(a1))  #[[1 1 1][1 1 1]]

3.数组的属性

(1)数组维度:np.ndarray.shape

(2)数组元素的数据类型:np.ndarray.dtype

(3)数组元素的个数:np.ndarray.size

(4)数组元素的索引(下标)

(5)数组属性汇总

4.数组的组合和拆分

原文地址:https://www.cnblogs.com/lennie-luo/p/11773739.html

时间: 2024-08-27 19:39:17

数据分析(Numpy基础)的相关文章

利用 Python 进行数据分析(五)NumPy 基础:ndarray 索引和切片

概念理解 索引即通过一个无符号整数值获取数组里的值. 切片即对数组里某个片段的描述. 一维数组 一维数组的索引 一维数组的索引和Python列表的功能类似: 一维数组的切片 一维数组的切片语法格式为array[index1:index2],意思是从index1索引位置开始,到index2索引(不包括index2)位置结束的一段数组.例如: 当把一个值赋值为一个切片时,该值会作用于此数组片段里每一个元素,例如: 二维数组 二维数组的索引 当以一维数组的索引方式访问一个二维数组的时候,获取的元素不在

利用 Python 进行数据分析(四)NumPy 基础:ndarray 简单介绍

一.NumPy 是什么 NumPy 是 Python 科学计算的基础包,它专为进行严格的数字处理而产生.在之前的随笔里已有更加详细的介绍,这里不再赘述. 利用 Python 进行数据分析(一)简单介绍 二.ndarray 是什么 ndarray 是一个多维的数组对象,具有矢量算术运算能力和复杂的广播能力,并具有执行速度快和节省空间的特点. ndarray 的一个特点是同构:即其中所有元素的类型必须相同. 三.ndarray 的创建 array() 函数 最简单的方法, 使用 NumPy 提供的

《利用python进行数据分析》读书笔记--第四章 numpy基础:数组和矢量计算

第四章 Numpy基础:数组和矢量计算 实话说,用numpy的主要目的在于应用矢量化运算.Numpy并没有多么高级的数据分析功能,理解Numpy和面向数组的计算能有助于理解后面的pandas.按照课本的说法,作者关心的功能主要集中于: 用于数据整理和清理.子集构造和过滤.转换等快速的矢量化运算 常用的数组解法,如排序.唯一化.集合运算等 高效的描述统计和数据聚合/摘要运算 用于异构数据集的合并/连接运算的数据对齐和关系型数据运算 将条件逻辑表述为数组表达式(而不是带有if-elif-else分支

《利用python进行数据分析》NumPy基础:数组和矢量计算 学习笔记

一.有关NumPy (一)官方解释 NumPy is the fundamental package for scientific computing with Python. It contains among other things: a powerful N-dimensional array object sophisticated (broadcasting) functions tools for integrating C/C++ and Fortran code useful

《利用Python进行数据分析&#183;第2版》第四章 Numpy基础:数组和矢量计算

<利用Python进行数据分析·第2版>第四章 Numpy基础:数组和矢量计算 numpy高效处理大数组的数据原因: numpy是在一个连续的内存块中存储数据,独立于其他python内置对象.其C语言编写的算法库可以操作内存而不必进行其他工作.比起内置序列,使用的内存更少(即时间更快,空间更少) numpy可以在整个数组上执行复杂的计算,而不需要借助python的for循环 4.0 前提知识 数据:结构化的数据代指所有的通用数据,如表格型,多维数组,关键列,时间序列等 相关包:numpy pa

NumPy基础:数组和失量计算

NumPy : Numerical Python,是高性能科学计算和数据分析的基础包. 部分功能: ndarray:一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组: 用于对整组数据进行快速运算的标准数学函数(无需编写循环): 用于读写磁盘数据的工具以及用于操作内存映射文件的工具: 线性代数.随机数生成以及傅里叶变换功能: 用于集成C.C++.Fortran等语言编写的代码工具: 大部分数据分析应用关注的功能: 用于

python数据分析Numpy(二)

Numpy (Numerical Python) 高性能科学计算和数据分析的基础包: ndarray,多维数组(矩阵),具有矢量运算能力,快速.节省空间: 矩阵运算,无需循环,可以完成类似Matlab中的矢量运算: 线性代数.随机送生成: ndarray ,N维数组对象(矩阵) 所有元素必须是相同类型 ndim属性,维度个数 shape属性,各维度大小 dtype属性,数据类型 代码示例: import numpy # 生成指定维度的随机多维数据(两行三列) data = numpy.rando

Numpy基础笔记

Numpy简介 Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包.其部分功能如下: ①ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组.    ②用于对整组数据进行快速运算的标准数学函数(无需编写循环).    ③用于读写磁盘数据的工具以及用于操作内存映射文件的工具.    ④线性代数.随机数生成以及傅里叶变换功能. ⑤用于集成由C.C++.Fortran等语言编写的代码的工具. 创建数组 创建数组最简单的办法是使用array函数

numpy基础入门

本人小白一枚,最近在精读<利用Python进行数据分析>虽然书中的代码实现是python2版本的,但准备手工把其中的代码用Python3敲一遍,希望可以尽快读完. Numpy简介 Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包.其部分功能如下: ①ndarray,一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. ②用于对整组数据进行快速运算的标准数学函数(无需编写循环). ③用于读写磁盘数据的工具以及用于操作内存映射文件的工具. ④线性代数