#-*- coding:utf-8 -*- import numpy as np; data1=[1,2,3,4,5] array1=np.array(data1) #创建数组/矩阵 # 使用numpy中的array函数 data2=[[1,3,4],[2,5,6]] array2=np.array(data2) #查看变量的数据类型:dtype array2.dtype #转换数据格式 astype array2_str=array2.astype(‘str‘) array2_str.dtype ## pandas 有两个数据结构:Series和 DataFrame ## Series类似一维数组,和array很像,由一组数据和数据标签(类似索引)组成 ## Series 能自动对齐索引,如果对不上,会NaN表示缺失 import pandas as pd; s=pd.Series([1,2,3,4]); s1=pd.Series([1,2,3,4],index=[‘a‘,‘b‘,‘c‘,‘d‘]) s.index s[1] s[[1,2]] #字典 d={‘qiulu‘:‘handsome‘, ‘lulu‘:‘graceful‘ } s2=pd.Series(d) ## DataFrame是一个表格型的数据结构,类似一张excel表格或者SQL ##最常用的构建DataFrame的方法是:传入一个字典 dict={ ‘name‘:[‘张三‘,‘李四‘,‘王五‘,‘赵六‘], ‘sex‘:[‘男‘,‘男‘,‘男‘,‘女‘], ‘age‘:[18,19,20,21] } df=pd.DataFrame(dict) df.info() ## 查看数据类型 df.age.astype(‘str‘) df[‘age‘] df[‘age‘]=[19,20,21,22] df[‘country‘]=‘china‘ # DataFrame查询会特别方便 df[df.age==20] df[(df.age>=20) & (df.sex==‘男‘)] # query 可以类似SQL的查询方式 df.query(‘(age>18 and sex=="男") or (age<21 and sex=="女")‘) df1=pd.DataFrame(np.arange(4).reshape(2,2),columns=[‘a‘,‘b‘]) df2=pd.DataFrame(np.arange(12).reshape(2,6),columns=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘,‘f‘]) ## iloc 序号 ## loc 标签 ## ix 行+列,序号标签都行
时间: 2024-12-10 06:00:23