numpy+pandas 基础学习

#-*- coding:utf-8 -*-
import numpy as np;

data1=[1,2,3,4,5]
array1=np.array(data1)

#创建数组/矩阵
# 使用numpy中的array函数
data2=[[1,3,4],[2,5,6]]
array2=np.array(data2)

#查看变量的数据类型：dtype
array2.dtype

#转换数据格式 astype
array2_str=array2.astype(‘str‘)
array2_str.dtype

## pandas 有两个数据结构：Series和 DataFrame
## Series类似一维数组，和array很像，由一组数据和数据标签（类似索引）组成
## Series 能自动对齐索引，如果对不上，会NaN表示缺失
import pandas as pd;
s=pd.Series([1,2,3,4]);
s1=pd.Series([1,2,3,4],index=[‘a‘,‘b‘,‘c‘,‘d‘])
s.index
s[1]
s[[1,2]]

#字典
d={‘qiulu‘:‘handsome‘,
   ‘lulu‘:‘graceful‘
   }
s2=pd.Series(d)

## DataFrame是一个表格型的数据结构，类似一张excel表格或者SQL
##最常用的构建DataFrame的方法是：传入一个字典
dict={
    ‘name‘:[‘张三‘,‘李四‘,‘王五‘,‘赵六‘],
    ‘sex‘:[‘男‘,‘男‘,‘男‘,‘女‘],
    ‘age‘:[18,19,20,21]
}

df=pd.DataFrame(dict)

df.info()  ## 查看数据类型
df.age.astype(‘str‘)
df[‘age‘]

df[‘age‘]=[19,20,21,22]
df[‘country‘]=‘china‘

# DataFrame查询会特别方便
df[df.age==20]
df[(df.age>=20) & (df.sex==‘男‘)]

# query　可以类似ＳＱＬ的查询方式
df.query(‘(age>18 and sex=="男") or (age<21 and sex=="女")‘)

df1=pd.DataFrame(np.arange(4).reshape(2,2),columns=[‘a‘,‘b‘])
df2=pd.DataFrame(np.arange(12).reshape(2,6),columns=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘,‘f‘])

## iloc　　序号
## loc　　　标签
## ix　　　行＋列，序号标签都行

时间： 2024-12-10 06:00:23

numpy+pandas 基础学习的相关文章

Pandas基础学习与Spark Python初探

摘要:pandas是一个强大的Python数据分析工具包,pandas的两个主要数据结构Series(一维)和DataFrame(二维)处理了金融,统计,社会中的绝大多数典型用例科学,以及许多工程领域.在Spark中,python程序可以方便修改,省去java和scala等的打包环节,如果需要导出文件,可以将数据转为pandas再保存到csv,excel等. 1.Pandas是什么? pandas是一个强大的Python数据分析工具包,是一个提供快速,灵活和表达性数据结构的python包,旨在使

pandas基础学习一

生成对象用值列表生成 Series 时,Pandas 默认自动生成整数索引: In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8]) In [4]: s Out[4]: 0 1.0 1 3.0 2 5.0 3 NaN 4 6.0 5 8.0 dtype: float64 用含日期时间索引与标签的 NumPy 数组生成 DataFrame: In [5]: dates = pd.date_range('20130101', periods=6) In [6]

pandas 基础学习

import numpy as np import pandas as pd s = pd.Series([1, 3, 6, np.nan, 10, 23]) print(s) dates = pd.date_range('20180101', periods=4) print(dates) df = pd.DataFrame(np.random.randn(4, 5), index=dates, columns=['a', 'b', 'c', 'd', 'e']) print(df) df =

pandas基础学习（1）

1.介绍 pandas是常用的数据分析库,用于处理表格型或者异质性数据,主要有两种数据类型:Series和DataFrame. 本文采用的是Jupyter notebook , 导入库语句:import pandas as pd Series是一维数据型对象,粗略的理解,有一点似于C语言中的数组值values+可重新命名的index,即索引,可以认为是一个长度固定的字典.是DataFrame的组成部分. DataFrame是二维结构,是一张表,有两条轴,axis=0(index行)与 axis=

Numpy 基础学习

Numpy是python科学计算的基础包,为python提供快速的数组处理能力,也可以作为在算法之间传递数据的容器安装相关软件包安装需要的包 pip3 install numpy/pandas/mtaplotlib/ipython/scipy/xlrd/lxml/basemap/pymogo/PyQt/statsmodels/PyTables 验证ipython Numpy NumPy的主要对象是同质多维数组.它是一张表,所有元素(通常是数字)的类型都相同,并通过正整数元组索引.在NumPy

python学习笔记（四）：pandas基础

pandas 基础 serise import pandas as pd from pandas import Series, DataFrame obj = Series([4, -7, 5, 3]) obj 0 4 1 -7 2 5 3 3 dtype: int64 obj.values array([ 4, -7, 5, 3], dtype=int64) obj.index RangeIndex(start=0, stop=4, step=1) obj[[1,3]] # 跳着选取数据 1

Numpy&Pandas

Numpy & Pandas 简介此篇笔记参考来源为<莫烦Python> 运算速度快:numpy 和 pandas 都是采用 C 语言编写, pandas 又是基于 numpy, 是 numpy 的升级版本. 消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快好多 Numpy 学习 2.1 numpy属性 ndim:维度 shape:行数和列数 size:元素个数举例说明: import numpy as np array = np.array([[1,2,3]

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库

课程简介:? ? 课程风格通俗易懂,真实案例实战.精心挑选真实的数据集为案例,通过Python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例.课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例.算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习.旨在帮助同学们快速上手如何使用python库来完整机器学习案例. ------------------

数据分析模块Numpy Pandas

如何使用Python进行量化投资自己编写:NumPy+pandas+Matplotlib+…… 在线平台:聚宽.优矿.米筐.Quantopian.…… 开源框架:RQAlpha.QUANTAXIS.…… IPython:安装:pip install ipython TAB键自动完成 ?命令(内省.命名空间搜索) 执行系统命令(!) %run命令执行文件代码 %paste %cpaste命令执行剪贴板代码与编辑器和IDE交互魔术命令:%timeit %pdb … 使用命令历史输入与输出变量