Numpy常用数据结构、数据清洗函数、数据结构series和方法、数据结构dataframe和方法

Numpy常用数据结构

1. 数组创建

In [ ]:

# 导入库
import numpy as np

In [ ]:

arr1 = np.array([-9,7,4,3])

In [ ]:

arr1

In [ ]:

arr2 = np.array([-9,7,4,3],dtype =float)# 尝试改变为int或者str

In [ ]:

print(arr2)

In [ ]:

arr3 = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

In [ ]:

arr3

In [ ]:

# 使用其他函数创建数组
np.arange(0,10,1)

In [ ]:等差

np.linspace(1,10,10)

In [ ]:零矩阵

np.zeros([4,5])

In [ ]:全是一的矩阵

np.ones([2,3])

In [ ]:

arr3 + 1 #矩阵运算

2. 数组方法

In [ ]:

# 查看数组维度
arr3.ndim

In [ ]:几行几列

arr3.shape

In [ ]:里面的元素个数

arr3.size

In [ ]:里面的元素类型

arr3.dtype

In [ ]:

arr3 + 1 #矩阵运算

In [ ]:

arr3 /2

In [ ]:

data2 = ((8.5,6,4.1,2,0.7),(1.5,3,5.4,7.3,9),(3.2,4.5,6,3,9),(11.2,13.4,15.6,17.8,19))
arr2 = np.array(data2)

In [ ]:

arr2

In [ ]:

arr2[2] #访问第三行,可以理解为行索引

In [ ]:

arr2[2,1] #访问第三行,可以理解为行索引

In [ ]:

arr2[:,2:4] #访问第三列

In [ ]:

arr2[1:3] #2行和3行

In [ ]:

arr2[1:,2:] #第2行到最后一行,第3列到最后一列

In [ ]:

arr2[2,1] #访问第三行,第二个元素,第一个是行索引,第二个是列索引

In [ ]:和上面一个效果相同

arr2[2][1] #访问第三行,第二个元素,第一个是行索引,第二个是列索引

3. Numpy常用数据清洗函数

  • 排序
  • 降序建议用sorted函数

In [ ]:

s  = np.array([1,2,3,4,3,1,2,2,4,6,7,2,4,8,4,5])

In [ ]:

np.sort(s)

In [ ]:

sorted(s,reverse =True)#降序

In [ ]:

arr1 = np.array([[0,1,3],[4,2,9],[4,5,9],[1,-3,4]])

In [ ]:

arr1

In [ ]:

np.sort(arr1)

In [ ]:

np.sort(arr1,axis = 0) # 0代表沿着行的方向, 1代表沿着列的方向
arr1 = np.array([[0,1,3],[4,2,9],[4,5,9],[1,-3,4]])对于这里的理解可以理解为矩阵的转制的概念,也就是013 429 459 1-34分别表示列向量所谓行,就是每一个元素里面的第n个,比如这里的0,4,4,1
所谓列,就是一个元素里面的所有数,比如这里的0,1,3

In [ ]:

np.sort(arr1,axis = 1)
  • argsort返回的是排完序以后,在原数据中的索引位置
  • 返回的是数据中,从小到大的索引值

In [ ]:

s = np.array([1,2,3,4,3,1,2,2,4,6,7,2,4,8,4,5])

In [ ]:

np.argsort(s)
  • np.where和np.extract

In [ ]:

np.where(s>3,1,-1)# 满足条件的,赋值为1,不满足的赋值为-1,返回的数据长度和s一样

np.where(s>3,s,-1)# 满足条件的,赋值为本身,不满足的赋值为-1,返回的数据长度和s一样
  • np.extract 只会输出满足条件的数据

In [ ]:

筛选

np.extract(s>3,s)# 只输出满足条件的数据

4. Pandas常用数据结构

series序列

In [ ]:

import pandas as pd
import numpy as np

In [ ]:

# 构造序列
series1 = pd.Series([2.8,3.01,8.99,8.59,5.18])

In [ ]:index就是索引,name是序列的名字

series2 = pd.Series([2.8,3.01,8.99,8.59,5.18],index = [‘a‘,‘b‘,‘c‘,‘d‘,‘e‘],name =‘这是一个series‘)

In [ ]:

series3 = pd.Series({‘北京‘:2.8,‘上海‘:3.01,‘广东‘:8.99,‘江苏‘:8.59,‘浙江‘:5.18})这个时候中文的地方会变成索引,而后面分别跟者值可以通过series3[0] series3[‘北京‘]得到2.8
可以通过series3[0:3]得到‘北京‘:2.8,‘上海‘:3.01,‘广东‘:8.99。 左闭右开

可以通过series3[‘北京‘:‘江苏‘]得到之间所有的值      左闭右闭

 

In [ ]:

#series方法
series2.values   输出到是值

In [ ]:

series3.index        输出的是健

dafaframe

In [ ]:列表

# 构造数据框
#数据框其实就是一个二维表结构,是数据分析中,最常用的数据结构
list1 = [[‘张三‘,23,‘男‘],[‘李四‘,27,‘女‘],[‘王二‘,26,‘女‘]]#使用嵌套列表
df1 = pd.DataFrame(list1,columns=[‘姓名‘,‘年龄‘,‘性别‘])

In [ ]:

type(df1)

In [ ]:字典,键就是列标签

df2 = pd.DataFrame({‘姓名‘:[‘张三‘,‘李四‘,‘王二‘],‘年龄‘:[23,27,26],‘性别‘:[‘男‘,‘女‘,‘女‘]}) #使用字典,字典的键被当成列名

In [ ]:

df2

In [ ]:数组

array1 = np.array([[‘张三‘,23,‘男‘],[‘李四‘,27,‘女‘],[‘王二‘, 26,‘女‘]]) #使用numpy
df3 = pd.DataFrame(array1,columns=[‘姓名‘,‘年龄‘,‘性别‘],index = [‘a‘,‘b‘,‘c‘] )

行标签是index,列标签是columns

In [ ]:

#dataframe方法所有的除标签外的值
df2.values

In [ ]:行标签

df2.index

In [ ]:列标签,这个只针对da ta f ra me有用

df2.columns
df2.columns.tolist()转变为列表的格式

In [ ]:数据的类型

df2.dtypes

In [ ]:维度

df2.ndim

In [ ]:多少个元素

df2.size

In [ ]:

df2.shape

原文地址:https://www.cnblogs.com/xingnie/p/12259723.html

时间: 2024-10-29 05:11:47

Numpy常用数据结构、数据清洗函数、数据结构series和方法、数据结构dataframe和方法的相关文章

Numpy 常用矩阵计算函数

基本属性 在做一些数据分析的时候,我们通常会把数据存为矩阵的形式,然后python本身对于矩阵的操作是不够的,因此出现了numpy这样一个科学开发库来进行python在次上面的不足. Numpy's array 类被称为ndarray. 这个对象常用而重要的属性如下: ndarray.ndim: 输出矩阵(数组)的维度 ndarray.shape: 输出矩阵的各维数大小,相当于matlab中的size()函数 ndarray.size: 输出矩阵(数组)元素的总个数,相当于各维数之积 ndarr

numpy 常用工具函数 —— np.bincount/np.average

numpy 常用工具函数 -- np.bincount/np.average numpy 常用api(一) numpy 常用api(二) 一个函数提供 random_state 的关键字参数(keyword parameter):是为了结果的可再现性(reoccurrence)或叫可重复性. 1. np.bincount():统计次数 接口为: numpy.bincount(x, weights=None, minlength=None) 1 尤其适用于计算数据集的标签列(y_train)的分布

python pandas numpy matplotlib 常用方法及函数

import numpy as np import pandas as pd import matplotlib.pyplot as plt ---------------numpy----------------------- arr = np.array([1,2,3], dtype=np.float64) np.zeros((3,6)) np.empty((2,3,2)) np.arange(15) arr.dtype arr.ndim arr.shape arr.astype(np.in

php 常用的系统函数

php 常用的系统函数 本文介绍了php 常用的系统函数,具有很好的参考价值,下面跟着 大宝儿 一起来看下吧 字符串函数        strlen():获取字符串长度,字节长度 substr():字符串截取,获取字符串(按照字节进行截取) strchr():与substr相似,从指定位置截取一直到最后 strrchr(获取文件后缀名):与strchr一样,只是从右边开始查找字符 strtolower():所有的字符都小写(针对英文字母) strtoupper():所有的字符都大写 strrev

常用的OpenCV函数速查

常用的OpenCV函数速查 1.cvLoadImage:将图像文件加载至内存: 2.cvNamedWindow:在屏幕上创建一个窗口: 3.cvShowImage:在一个已创建好的窗口中显示图像: 4.cvWaitKey:使程序暂停,等待用户触发一个按键操作: 5.cvReleaseImage:释放图像文件所分配的内存: 6.cvDestroyWindow:销毁显示图像文件的窗口: 7.cvCreateFileCapture:通过参数设置确定要读入的AVI文件: 8.cvQueryFrame:用

图像处理和图像识别中常用的OpenCV函数

1.   cvLoadImage:将图像文件加载至内存: 2.   cvNamedWindow:在屏幕上创建一个窗口: 3.   cvDestroyWindow:销毁显示图像文件的窗口: 4.   cvDestroyAllWindows:销毁显示图像文件的所有窗口: 5.   cvShowImage:在一个已创建好的窗口中显示图像: 6.   cvWaitKey:使程序暂停,等待用户触发一个按键操作: 7.   cvReleaseImage:释放图像文件所分配的内存: 8.   cvCreate

PHP中的数组(二)常用数组处理函数

数组的相关处理函数    一.数组键/值操作有关的函数        1.array_values()   无论是关联的还是索引的返回的都是索引数组 1 <?php 2 $lamp=array("os"=>"Linux","webserver"=>"Apache","db"=>"Mysql","language"=>"php&q

python day4笔记 常用内置函数与装饰器

1.常用的python函数 abs             求绝对值 all               判断迭代器中所有的数据是否为真或者可迭代数据为空,返回真,否则返回假 any             判断迭代器中的数据是否有一个为真,有返回真,可迭代数据为空或者没有真,返回假 bin             转换整数为二进制字符串 hex            转换整数为十六进制字符串 oct             转换整数为八进制字符串 bool           转换数据为布尔值

项目开发中常用的PHP函数

日期操作 为了便于存储.比较和传递,我们通常需要使用strtotime()函数将日期转换成UNIX时间戳,只有在显示给用户看的时候才使用date()函数将日期转换成常用的时间格式. strtotime()  函数将任何英文文本的日期时间描述解析为 Unix 时间戳 eg: <?php echo(strtotime("now")); echo(strtotime("3 October 2005")); echo(strtotime("+5 hours&