Python数据分析与展示[第一周]

ipython 中的问号

获得相关的描述信息

%run 系统文件

执行某一个文件

ipython的模式命令

%magic 显示所有的魔术命令

%hist    命令历史输入信息

%pdb    异常发生后自动进入调试器

%reset  删除当前命名空间中的全部变量或名称

%who   显示Ipython 当前命名空间中的已经定义的变量

%time statemnent 给出代码执行时间

%timeit statement 多次实行代码,计算平均执行时间

基本读取数据的方法

维度:数据的组织形式

一维数据 列表 数组

一组数据的结构 列表中 数据类型可以不同,数组类型相同

二位数据 多个一维数据的组合形式

多维数据 在性维度上的扩展形成

高维数据 字典

一位数据 列表(有序) 集合(无序)

高维数据 字典形式或数据表示格式(json xml yaml)

numpy

np.ndarray

import numpy as np

使一维向量像变量

一个维度数据类型往往相同 节省内存和时间

ndarray

实际数据

描述数据的元数据

下表从0开始

轴axis 数据的维度

秩rank 轴的数量

ndarray 对象的属性

.ndim 秩轴的数量 或 维度的数量

.shape 对象的尺度 n行m列

.size   对象元素的个数

.dtype 对象的元素类型

.itemsize 为各元素的大小以字节为单位

ndarray的元素类型

bool

intc 32或64

int p  用于索引的整数 与c中的 sszie_t 一致 int32 或 int64

int8 int16 int32 int64

uint8-16-32-64

float16-32-64/

complex64           实部虚部都是32位浮点数类型

complex128         实部虚部都是64位浮点数类型

当每一个元素行传不相同的时候 非同质对象 尽量避免使用

生成ndarray 的方法

1从列表元组中创建

np.array(     ,dtype=np.float32) 可以指定类型

2使用函数创建

np.arange()  元素从0到n-1

np.ones(shape)     根据shape 生成一个全1的类型,shape 是一个元组类型

np.zeros(shape)    同上

np.full(shape,val)        生成权威val的

np.eye(n)   n阶的单位矩阵

np.ones_like(a) 形状相似

np.zeros_like(a)

np.zeros_like(a,val)

np.linspace(1,10,4, endpoint=False) 起始位置 种质元素 包含几个元素

np.logspace(1,2,base=4)  4^1 - 4^2 的等比数列

np.concatenate((a,b)) 将两个nparray合并

ndarray的方法

.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变

.resize(shape)    修改原数组(原数组改变)   resize 不接受负数(-1) reshape 可以

.swapaxes(ax1,ax2) 对n维中的两个维度进行调换

.flatten()               对数组进行降维,返回一个一维数组 ,原数组不变

ndarray的类型变换

new_a=a.astype(new_type)  // np.int 具体是那种类型有py自行决定

(不改变原数据)创建新的数组,拷贝

数组转列表

.tolist()

//慢得多

数组操作 索引切片

a[1:4:2]    开始编号:终止编号:步长

不含终值

a[0,1,2] 这是可以的

a[-1,-2,-3]这是表示从右向左的索引方式

a[:,1,-3]

a[:,1:3,:]

a[:,:,::2] 最后一个维度以2为步长

ndarray的运算

标量运算

1数组中的每一个元素都与之进行运算

a=a/a.mean()

标量元素

np.abs(x)

np.fabs()

np.sqrt()

np.squar()

np.log() np.log10() np.log2()

np.ceil() np.floor()

np.rint() 四舍五入

np.modf() 将数组的小数和整数分别以两个独立的数组形式返回

np.cos cosh sin sinh tan tanh

np.exp()

np.sign()

+-*/**

np.maximum(x,y)  np.fmax()

np.minimum(x,y)   np.fmin() 求对应的最大值最小值

np.mod(x,y)   元素及的模运算

np.copysign(x,y)   将y元素的符号复制给对应数组x中的对应元素

><==!=产生bool型的数组

时间: 2024-10-13 22:23:33

Python数据分析与展示[第一周]的相关文章

Python数据分析与展示(1)-数据分析之表示(1)-NumPy数据存取与函数

NumPy数据存取与函数 数据的CSV文件存取 CSV文件 CSV(Comma-Separated Value,逗号分隔值) CSV是一种常见的文件格式,用来存储批量数据. 将数据写入CSV文件 np.savetxt(frame, array, fmt='%.18e', delimiter=None) -frame: 文件.字符串或产生器,可以是.gz或.bz2的压缩文件 -array: 存入文件的数组 -fmt: 写入文件的格式,例如:%d %.2f %.18e -delimiter:分割字符

萌新向Python数据分析及数据挖掘 第一章 Python基础 (上)未排版

因word和博客编辑器格式不能完全对接,正在重新排版,2019年1月1日发出第一章完整版 本文将参考<Python编程 从入门到实践>的讲述顺序和例子,加上自己的理解,让大家快速了解Python的基础用法,并将拓展内容的链接添加在相关内容之后,方便大家阅读. 好了!我们开始第一章的学习. 第一章 Python基础 python安装以及环境搭建 python的安装和环境变量的配置通过百度查询即可解决,这里不作赘述. IDE的选择:因为后期需要用来做数据分析,所以直接安装Anaconda会是一个不

萌新向Python数据分析及数据挖掘 第一章 Python基础 第一节 python安装以及环境搭建 第二节 变量和简单的数据类型

本文将参考<Python编程 从入门到实践>的讲述顺序和例子,加上自己的理解,让大家快速了解Python的基础用法,并将拓展内容的链接添加在相关内容之后,方便大家阅读. 好了!我们开始第一章的学习. 第一章 Python基础 第一节 Python安装以及环境搭建 Python的安装和环境变量的配置通过百度查询即可解决,这里不作赘述. IDE的选择:因为后期需要用来做数据分析,所以直接安装Anaconda会是一个不错的选择. Anaconda详细安装使用教程 https://blog.csdn.

萌新向Python数据分析及数据挖掘 第一章 Python基础 第八节 函数

第一章 Python基础 第八节 函数 定义函数 函数 其实就可以理解为外挂,把一些常用的.重复率比较多你又不想重复写的东西写进函数,加上开关实现简化操作 举个简单的例子 1 def greet_user(username): 2 #定义一个叫做"迎接用户"的外挂,让他能直接打印一个问候语,括号里面是函数需要输入的东西,也就是个性化的东西 3 """先是简单的问候语""" 4 print("Hello! "

萌新向Python数据分析及数据挖掘 第一章 Python基础 第九节 类

第一章 Python基础 第九节 类 面向对象编程时,都会遇到一个概念,类,python也有这个概念,下面我们通过代码来深入了解下. 其实类 和函数都是为了节省代码,有了类的的概念,就可以把相同的代码写在父类,子类继承后就可以直接使用,而且通过选择对应的父类就可以直接使用对应父类的内容. 创建和使用类 1 class Dog(): #认识狗这类东西 2 def __init__(self, name, age): #狗是肯定有名字和年龄的,是个狗就有,要用户填写 3 self.name = na

萌新向Python数据分析及数据挖掘 第一章 Python基础 第十节 文件和异常

第一章 Python基础 第十节 文件和异常 从文件中读取数据 读取文件.文件路径   1 filename = 'pi_digits.txt' #文件名取个代号 2 #读取整个文件 3 with open(filename) as file_object: 4 contents = file_object.read()# 给内容取个代号 5 print(contents.rstrip()) 6 #逐行读取 7 with open(filename) as file_object: 8 for

Python学习之旅--第一周--初识Python

一:Python是一种什么样的语言? 1.语言的分类: a.编译型语言和解释性语言: 通常所说的计算机语言分为编译型和解释型语言.编译型语言典型的如C,C++,通常在程序执行之前必须经由编译器编译成机器可识别的可执行文件.而解释型语言则不用预先编译,在程序执行过程中由解释器逐行解释成二进制代码供计算机执行.典型的如JAVA,JAVASCRIPT,VBSCRIPT,PYTHON等通常编译型语言因预先进行了编译,所以执行效率较高,而解释型语言效率稍慢. b.静态语言和动态语言: 静态语言和动态语言一

python学习笔记(第一周):变量

在python中申明一个变量,不需要申明变量的类型,如下: name = "Eraser Li" 打印变量,代码如下: print("My name is",name) 控制台输出结果: My name is Eraser Li 变量赋值给变量: name2 = name print("My name is",name2) 控制台输出结果: My name is Eraser Li 现在给name重新赋值: name = "Eraser

Python数据分析与展示(二):数据分析与展示

数据的CSV文件存取: 1 np.savetxt(frame, array, fmt='%.18e', delimiter=None) 2 ? frame : 文件.字符串或产生器,可以是.gz或.bz2的压缩文件 3 ? array : 存入文件的数组 4 ? fmt : 写入文件的格式,例如:%d %.2f %.18e 5 ? delimiter : 分割字符串,默认是任何空格 1 np.loadtxt(frame, dtype=np.float, delimiter=None, unpac