numpy、pandas、matplotlib的用法

一。 数组要比列表效率高很多
    numpy高效的处理数据,提供数组的支持,python默认没有数组。pandas、scipy、matplotlib都依赖numpy。
    pandas主要用于数据挖掘,探索,分析
    maiplotlib用于作图,可视化
    scipy进行数值计算,如:积分,傅里叶变换,微积分
    statsmodels用于统计分析
    Gensim用于文本挖掘
    sklearn机器学习, keras深度学习
二。
    numpy和mkl 下载安装
    pandas和maiplotlib网络安装
    scipy 下载安装
    statsmodels和Gensim网络安装
三numpy的操作。
    import numpy
    # 创建数一维数组组
    # numpy.array([元素1,元素2,......元素n])
    x = numpy.array([‘a‘, ‘9‘, ‘8‘, ‘1‘])
    # 创建二维数组格式
    # numpy.array([[元素1,元素2,......元素n],[元素1,元素2,......元素n],[元素1,元素2,......元素n]])
    y = numpy.array([[3,5,7],[9,2,6],[5,3,0]])
    # 排序
    x.sort()
    y.sort()
    # 取最大值
    y1 = y.max()
    # 取最小值
    y2 = y.main()
    # 切片
四pandas的操作。
    import pandas as pda
    # 使用pandas生成数据
    # Series代表某一串数据 index指定行索引名称,Series索引默认从零开始
    # DataFrame代表行列整合出来的数据框,columns 指定列名
    a = pda.Series([8, 9, 2, 1], index=[‘one‘, ‘two‘, ‘three‘, ‘four‘])
    # 以列表的格式创建数据框
    b = pda.DataFrame([[5,6,2,3],[3,5,1,4],[7,9,3,5]], columns=[‘one‘, ‘two‘, ‘three‘, ‘four‘],index=[‘one‘, ‘two‘, ‘three‘])
    # 以字典的格式创建数据框
    c = pda.DataFrame({
        ‘one‘:4, # 会自动补全
        ‘two‘:[6,2,3],
        ‘three‘:list(str(982))
    })
    # b.head(行数)# 默认取前5行头
    # b.tail(行数)# 默认取后5行尾
    # b.describe() 统计数据的情况  count mean std min 25% max
    e = b.head()
    f = b.describe()
    # 数据的转置,及行变成列,列变成行
    g = b.T
五python数据的导入
    import pandas as pad
    f = open(‘d:/大.csv‘,‘rb‘)
    # 导入csv
    a = pad.read_csv(f, encoding=‘python‘)
    # 显示多少行多少列
    a.shape()
    a.values[0][2] #第一行第三列
    # 描述csv数据
    b = a.describe()
    # 排序
    c = a.sort_values()
    # 导入excel
    d = pad.read_excel(‘d:/大.xls‘)
    print(d)
    print(d.describe())
    # 导入mysql
    import pymysql
    conn = pymysql.connect(host=‘localhost‘, user=‘root‘, passwd=‘root‘, db=‘‘)
    sql = ‘select * from mydb‘
    e = pad.read_sql(sql, conn)
    # 导入html表格数据 需要先安装 html5lib和bs4
    g = pad.read_html(‘https://book.douban.com/subject/30258976/?icn=index-editionrecommend‘)
    # 导入文本数据
    h = pad.read_table(‘d:/lianjie.txt‘,‘rb‘, engine=‘python‘)
    print(h.describe())
六matplotlib的使用
    # 折线图/散点图用plot
    # 直方图用hist
    import matplotlib.pylab as pyl
    import numpy as npy
    x = [1,2,4,6,8,9]
    y = [5,6,7,8,9,0]
    pyl.plot(x, y) #plot(x轴数据,y轴数据,展现形式)
    # o散点图,默认是直线 c cyan青色 r red红色 m magente品红色 g green绿色 b blue蓝色 y yellow黄色 w white白色
    # -直线  --虚线  -. -.形式  :细小虚线
    # s方形 h六角形  *星星  + 加号  x x形式 d菱形 p五角星
    pyl.plot(x, y, ‘D‘)
    pyl.title(‘name‘) #名称
    pyl.xlabel(‘xname‘) #x轴名称
    pyl.ylabel(‘yname‘) #y轴名称
    pyl.xlim(0,20) #设置x轴的范围
    pyl.ylim(2,22) #设置y轴的范围
    pyl.show()
    # 随机数的生成
    data = npy.random.random_integers(1,20,100) #(最小值,最大值,个数)
    # 生成具有正态分布的随机数
    data2 = npy.random.normal(10.0, 1.0, 10000) #(均值,西格玛,个数)
    # 直方图hist
    pyl.hist(data)
    pyl.hist(data2)
    # 设置直方图的上限下限
    sty = npy.arange(2,20,2) #步长也表示直方图的宽度
    pyl.hist(data, sty, histtype=‘stepfilled‘) # 去除轮廓
    # 子图的绘制和使用
    pyl.subplot(2, 2, 2) # (行,列,当前区域)
    x1 = [2,3,5,8,6,7]
    y1 = [2,3,5,9,6,7]
    pyl.plot(x1, y1)
    pyl.subplot(2, 2, 1) # (行,列,当前区域)
    x1 = [2,3,5,9,6,7]
    y1 = [2,3,5,9,6,7]
    pyl.plot(x1, y1)
    pyl.subplot(2, 1, 2) # (行,列,当前区域)
    x1 = [2,3,5,9,6,7]
    y1 = [2,3,9,5,6,7]
    pyl.plot(x1, y1)
    pyl.show()

来自:https://www.cnblogs.com/lianggege123/articles/9657831.html

原文地址:https://www.cnblogs.com/yoyowin/p/12023480.html

时间: 2024-08-30 16:32:10

numpy、pandas、matplotlib的用法的相关文章

Python——数据分析,Numpy,Pandas,matplotlib

由于图片内容太多,请拖动至新标签页再查看 Python--数据分析,Numpy,Pandas,matplotlib 原文地址:https://www.cnblogs.com/Jery-9527/p/10804069.html

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库

课程简介:? ? 课程风格通俗易懂,真实案例实战.精心挑选真实的数据集为案例,通过Python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例.课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例.算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习.旨在帮助同学们快速上手如何使用python库来完整机器学习案例. ------------------

numpy pandas matplotlib

import numpy as np import pandas as pd import matplotlib.pyplot as plt ---------------numpy----------------------- arr = np.array([1,2,3], dtype=np.float64) np.zeros((3,6))  np.empty((2,3,2)) np.arange(15) arr.dtype arr.ndim arr.shape arr.astype(np.i

11-2 numpy/pandas/matplotlib模块

目录 numpy模块 一维数组 二维数组 列表list和numpy的区别 获取多维数组的行和列 多维数组的索引 高级功能 多维数组的合并 通过函数方法创建多维数组 矩阵的运算 求最大值最小值 numpy生成随机数 pandas模块 pandas模块有什么用 Series(了解) DataFrame(掌握) 处理缺失值 合并数据 matplotlib模块 matplotlib模块有什么用? numpy模块 numpy模块导入时,注意需要设置别名为 np 一维数组 只有一行,相当于一条线 # 生成一

模块之numpy,pandas,matplotlib

numpy模块 numpy数组(矩阵)的运算, 科学运算, tensorflow pandas模块 文件(excel)的处理 read_excel()/to_excel() matplotlib模块 画图, plt.plot()/plt.bar()/plt.scatter()/plt.hist()/plt.pie() re模块 正则表达式,字符串内找特定的字符串 typing模块 获取一些数据类型,generator collections模块 增加一些特殊的数据类型 shutil模块 文件的解

数据分析模块Numpy Pandas

如何使用Python进行量化投资 自己编写:NumPy+pandas+Matplotlib+…… 在线平台:聚宽.优矿.米筐.Quantopian.…… 开源框架:RQAlpha.QUANTAXIS.…… IPython:安装:pip install ipython TAB键自动完成 ?命令(内省.命名空间搜索) 执行系统命令(!) %run命令执行文件代码 %paste %cpaste命令执行剪贴板代码 与编辑器和IDE交互 魔术命令:%timeit %pdb … 使用命令历史 输入与输出变量

linux下安装numpy,pandas,scipy,matplotlib,scikit-learn

python在数据科学方面需要用到的库: a.Numpy:科学计算库.提供矩阵运算的库. b.Pandas:数据分析处理库 c.scipy:数值计算库.提供数值积分和常微分方程组求解算法.提供了一个非常广泛的特定函数集合. d.Matplotlib:数据可视化库 e.Scikit-learn:机器学习库 安装顺序如下: 1.pip install numpy2.pip install pandas 3.pip install scipy (sudo apt-get install libatla

【数据分析&数据挖掘】numpy、pandas&matplotlib

1 import numpy as np 2 import pandas as pd 3 4 """ 5 numpy --科学计算库 6 核心---ndarray 7 本质: 存储单一数据类型的 内存连续的 N维数组 8 C F 风格存储 9 10 matplotlib ---数据可视化的库 11 能绘制2-D 与 3-D 图形 12 13 pandas ----进行数据处理的库 14 里面封装了部分numpy 与matplotlib 功能 15 结构核心: 16 常用两种结

Numpy&Pandas

Numpy & Pandas 简介 此篇笔记参考来源为<莫烦Python> 运算速度快:numpy 和 pandas 都是采用 C 语言编写, pandas 又是基于 numpy, 是 numpy 的升级版本. 消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快好多 Numpy 学习 2.1 numpy属性 ndim:维度 shape:行数和列数 size:元素个数 举例说明: import numpy as np array = np.array([[1,2,3]

[Python]在win32上安装Numpy和Matplotlib

平台: win7-32   python3.4.3 安装过程实在是太恶心了,整理了一下方便大家,没准搜索引擎能收录到了: 遇到的问题主要有: 1.各种找不到版本兼容的下载地址 2.下载到了 .whl & .egg文件不会安装 3.安装好了文件又缺各种  module    ImportError:No module named 'six'  No module named 'dateutil'  ImportError:No module named 'pyparsing' 好了~整理了一下,具