numpy+pandas 基础学习

#-*- coding:utf-8 -*-
import numpy as np;

data1=[1,2,3,4,5]
array1=np.array(data1)

#创建数组/矩阵
# 使用numpy中的array函数
data2=[[1,3,4],[2,5,6]]
array2=np.array(data2)

#查看变量的数据类型:dtype
array2.dtype

#转换数据格式 astype
array2_str=array2.astype(‘str‘)
array2_str.dtype

## pandas 有两个数据结构:Series和 DataFrame
## Series类似一维数组,和array很像,由一组数据和数据标签(类似索引)组成
## Series 能自动对齐索引,如果对不上,会NaN表示缺失
import pandas as pd;
s=pd.Series([1,2,3,4]);
s1=pd.Series([1,2,3,4],index=[‘a‘,‘b‘,‘c‘,‘d‘])
s.index
s[1]
s[[1,2]]

#字典
d={‘qiulu‘:‘handsome‘,
   ‘lulu‘:‘graceful‘
   }
s2=pd.Series(d)

## DataFrame是一个表格型的数据结构,类似一张excel表格或者SQL
##最常用的构建DataFrame的方法是:传入一个字典
dict={
    ‘name‘:[‘张三‘,‘李四‘,‘王五‘,‘赵六‘],
    ‘sex‘:[‘男‘,‘男‘,‘男‘,‘女‘],
    ‘age‘:[18,19,20,21]
}

df=pd.DataFrame(dict)

df.info()  ## 查看数据类型
df.age.astype(‘str‘)
df[‘age‘]

df[‘age‘]=[19,20,21,22]
df[‘country‘]=‘china‘

# DataFrame查询会特别方便
df[df.age==20]
df[(df.age>=20) & (df.sex==‘男‘)]

# query 可以类似SQL的查询方式
df.query(‘(age>18 and sex=="男") or (age<21 and sex=="女")‘)

df1=pd.DataFrame(np.arange(4).reshape(2,2),columns=[‘a‘,‘b‘])
df2=pd.DataFrame(np.arange(12).reshape(2,6),columns=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘,‘f‘])

## iloc  序号
## loc   标签
## ix   行+列,序号标签都行
时间: 2024-08-09 16:48:20

numpy+pandas 基础学习的相关文章

Pandas基础学习与Spark Python初探

摘要:pandas是一个强大的Python数据分析工具包,pandas的两个主要数据结构Series(一维)和DataFrame(二维)处理了金融,统计,社会中的绝大多数典型用例科学,以及许多工程领域.在Spark中,python程序可以方便修改,省去java和scala等的打包环节,如果需要导出文件,可以将数据转为pandas再保存到csv,excel等. 1.Pandas是什么? pandas是一个强大的Python数据分析工具包,是一个提供快速,灵活和表达性数据结构的python包,旨在使

pandas基础学习一

生成对象 用值列表生成 Series 时,Pandas 默认自动生成整数索引: In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8]) In [4]: s Out[4]: 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 用含日期时间索引与标签的 NumPy 数组生成 DataFrame: In [5]: dates = pd.date_range('20130101', periods=6) In [6]

pandas 基础学习

import numpy as np import pandas as pd s = pd.Series([1, 3, 6, np.nan, 10, 23]) print(s) dates = pd.date_range('20180101', periods=4) print(dates) df = pd.DataFrame(np.random.randn(4, 5), index=dates, columns=['a', 'b', 'c', 'd', 'e']) print(df) df =

pandas基础学习(1)

1.介绍 pandas是常用的数据分析库,用于处理表格型或者异质性数据,主要有两种数据类型:Series和DataFrame. 本文采用的是Jupyter notebook , 导入库语句:import pandas as pd Series是一维数据型对象,粗略的理解,有一点似于C语言中的数组值values+可重新命名的index,即索引,可以认为是一个长度固定的字典.是DataFrame的组成部分. DataFrame是二维结构,是一张表,有两条轴,axis=0(index行)与 axis=

Numpy 基础学习

Numpy是python科学计算的基础包,为python提供快速的数组处理能力,也可以作为在算法之间传递数据的容器 安装相关软件包 安装需要的包 pip3 install numpy/pandas/mtaplotlib/ipython/scipy/xlrd/lxml/basemap/pymogo/PyQt/statsmodels/PyTables 验证ipython Numpy NumPy的主要对象是同质多维数组.它是一张表,所有元素(通常是数字)的类型都相同,并通过正整数元组索引.在NumPy

python学习笔记(四):pandas基础

pandas 基础 serise import pandas as pd from pandas import Series, DataFrame obj = Series([4, -7, 5, 3]) obj 0 4 1 -7 2 5 3 3 dtype: int64 obj.values array([ 4, -7, 5, 3], dtype=int64) obj.index RangeIndex(start=0, stop=4, step=1) obj[[1,3]] # 跳着选取数据 1

Numpy&amp;Pandas

Numpy & Pandas 简介 此篇笔记参考来源为<莫烦Python> 运算速度快:numpy 和 pandas 都是采用 C 语言编写, pandas 又是基于 numpy, 是 numpy 的升级版本. 消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快好多 Numpy 学习 2.1 numpy属性 ndim:维度 shape:行数和列数 size:元素个数 举例说明: import numpy as np array = np.array([[1,2,3]

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库

课程简介:? ? 课程风格通俗易懂,真实案例实战.精心挑选真实的数据集为案例,通过Python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例.课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例.算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习.旨在帮助同学们快速上手如何使用python库来完整机器学习案例. ------------------

数据分析模块Numpy Pandas

如何使用Python进行量化投资 自己编写:NumPy+pandas+Matplotlib+…… 在线平台:聚宽.优矿.米筐.Quantopian.…… 开源框架:RQAlpha.QUANTAXIS.…… IPython:安装:pip install ipython TAB键自动完成 ?命令(内省.命名空间搜索) 执行系统命令(!) %run命令执行文件代码 %paste %cpaste命令执行剪贴板代码 与编辑器和IDE交互 魔术命令:%timeit %pdb … 使用命令历史 输入与输出变量