【数据分析&数据挖掘】numpy、pandas&matplotlib

 1 import numpy as np
 2 import pandas as pd
 3
 4 """
 5     numpy --科学计算库
 6     核心---ndarray
 7     本质: 存储单一数据类型的 内存连续的 N维数组
 8      C  F 风格存储
 9
10     matplotlib ---数据可视化的库
11     能绘制2-D  与 3-D 图形
12
13     pandas ----进行数据处理的库
14     里面封装了部分numpy  与matplotlib 功能
15     结构核心:
16     常用两种结构:
17     series  --存储一维结构
18     与dataframe相比,只含有行索引,没有列索引
19     dataframe(重中之重)----存储二维结构
20     数据相比ndarray  多了行索引、与列索引
21 """
22
23 # 将columns 与 values 合并为同一个数据----合并结果什么类型---数组
24 res = np.load("./国民经济核算季度数据.npz")
25 columns = res["columns"]
26 values = res["values"]
27
28 print("columns :\n", columns)
29 print("values :\n", values)
30 # print("*" * 100)
31 # #
32 # # numpy合并数据
33 res_array = np.concatenate((columns.reshape(1,-1), values), axis=0)
34 # print("res_array:\n",res_array)
35
36
37 # 将数组转化为dataframe
38 # 将 上面的columns  与 values 转化为pandas 中的dataframe结构
39 # data----真实数据
40 # index ---行索引的名称
41 # columns ---列索引的名称
42 index = ["index_"+ str(i) for i  in range(values.shape[0])]
43 print(index)
44
45 res_df = pd.DataFrame(data=values, columns=columns,index=index)
46 print("res_df:\n", res_df)
47
48 # # 自己创建一个df
49 df = pd.DataFrame(
50     data={
51         "name": ["zs", "ls", "ww"],
52         "score": [97, 89, 92.5],
53         "age": [21, 22, 23]
54     },
55     index=["stu_1", "stu_2", "stu_3"]
56 )
57 print("df:\n", df)
58
59 print("df 的维度:\n", df.ndim)
60 print("df的类型:\n", type(df))
61
62 # print("*" * 100)
63
64 # 将dataframe 转化为series
65 # series ???
66 se = df["name"]
67
68 print("se:\n",se)
69
70 print("se 的类型:\n",type(se))
71
72 # 自己创建series
73 # data --series 真实的值
74 se = pd.Series(
75     data=["zs","ls","ww"],
76     index=["stu_1","stu_2","stu_3"]
77 )
78 print("se:\n",se)
79 print("se 的维度:\n",se.ndim)
80 print("se 的类型:\n",type(se))
81
82
83 # numpy
84 arr = np.array([1,2,3,4])  # 将简单列表转化为数组
85 arr = np.array([[1,2,3,4],[2,3,4,5]])  # 将列表嵌套转化为数组
86 arr = np.array([[[1,2,3,4],[2,3,4,5]],[[1,2,3,4],[2,3,4,5]]])
87
88 print(‘arr:\n‘,arr)
89 print(‘arr的类型:\n‘,type(arr))  # <class ‘numpy.ndarray‘>
90 print(‘arr的维度: ‘, arr.ndim)
91 print(‘arr的形状: ‘, arr.shape)
92 print(‘arr的大小: ‘, arr.size)
93 print(‘arr元素的数据类型: ‘, arr.dtype)
94 print(‘arr每一个元素的大小 :‘, arr.itemsize)

原文地址:https://www.cnblogs.com/Tree0108/p/12116044.html

时间: 2024-07-29 15:40:46

【数据分析&数据挖掘】numpy、pandas&matplotlib的相关文章

Python——数据分析,Numpy,Pandas,matplotlib

由于图片内容太多,请拖动至新标签页再查看 Python--数据分析,Numpy,Pandas,matplotlib 原文地址:https://www.cnblogs.com/Jery-9527/p/10804069.html

数据分析模块Numpy Pandas

如何使用Python进行量化投资 自己编写:NumPy+pandas+Matplotlib+…… 在线平台:聚宽.优矿.米筐.Quantopian.…… 开源框架:RQAlpha.QUANTAXIS.…… IPython:安装:pip install ipython TAB键自动完成 ?命令(内省.命名空间搜索) 执行系统命令(!) %run命令执行文件代码 %paste %cpaste命令执行剪贴板代码 与编辑器和IDE交互 魔术命令:%timeit %pdb … 使用命令历史 输入与输出变量

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库

课程简介:? ? 课程风格通俗易懂,真实案例实战.精心挑选真实的数据集为案例,通过Python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例.课程以实战为基础,所有课时都结合代码演示如何使用这些python库来完成一个真实的数据案例.算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习.旨在帮助同学们快速上手如何使用python库来完整机器学习案例. ------------------

【数据分析&amp;数据挖掘】pandas的统计分析

1 # 在numpy 里面有统计分析, 对数值型数据进行统计指标 2 # np.max np.min np.mean np.std‘ 3 4 import pandas as pd 5 import numpy as np 6 7 # 1.加载数据 8 detail = pd.read_excel("../day05/meal_order_detail.xlsx") 9 # print("detail :\n", detail) 10 print("det

python数据分析之numpy+pandas+scipy+matplotlib+scikit-learn安装

摘要 利用python来进行数据分析的时候,需要安装一些常见的工具包,如numpy,pandas,scipy等等,在安装的过程中,经常遇到一些安装细节的问题,如版本不匹配,需要依赖包没有正确安装等等,本文汇总梳理了下几个必要安装包的安装步骤,希望对读者有帮助,环境是windows 64 bit+python2.7.11. 一.安装python2.7.11 进入官网:https://www.python.org/downloads/release/python-2711/ 下载如下的连接: 下载之

python入门、python数据分析(numpy、matplotlib、sklearn等)tensflow、爬虫、机器学习、深度学习、自然语言处理、数据挖掘、机器学习项目实战、python全栈、PHP、java、java web、openCV、hadoop、matlab、android、数据结构算法和刷题等教学视频

扫描二维码加好友购买视频,绝对优惠,谢谢支持. python入门和进阶熟练教学视频 入门: 进阶: python数据分析教学视频 python数据分析晋级班 tensorflow教程及实战 python爬虫教学 机器学习课程 深度学习课程 机器学习项目班 自然语言处理教学视频 python全栈教学视频 数据挖掘视频 PHP教学视频 java java web openCV教学视频 Hadoop教学视频 matlab教学 andriod教学视频 数据结构算法班及面试班 原文地址:https://w

numpy pandas matplotlib

import numpy as np import pandas as pd import matplotlib.pyplot as plt ---------------numpy----------------------- arr = np.array([1,2,3], dtype=np.float64) np.zeros((3,6))  np.empty((2,3,2)) np.arange(15) arr.dtype arr.ndim arr.shape arr.astype(np.i

11-2 numpy/pandas/matplotlib模块

目录 numpy模块 一维数组 二维数组 列表list和numpy的区别 获取多维数组的行和列 多维数组的索引 高级功能 多维数组的合并 通过函数方法创建多维数组 矩阵的运算 求最大值最小值 numpy生成随机数 pandas模块 pandas模块有什么用 Series(了解) DataFrame(掌握) 处理缺失值 合并数据 matplotlib模块 matplotlib模块有什么用? numpy模块 numpy模块导入时,注意需要设置别名为 np 一维数组 只有一行,相当于一条线 # 生成一

模块之numpy,pandas,matplotlib

numpy模块 numpy数组(矩阵)的运算, 科学运算, tensorflow pandas模块 文件(excel)的处理 read_excel()/to_excel() matplotlib模块 画图, plt.plot()/plt.bar()/plt.scatter()/plt.hist()/plt.pie() re模块 正则表达式,字符串内找特定的字符串 typing模块 获取一些数据类型,generator collections模块 增加一些特殊的数据类型 shutil模块 文件的解

python数据分析之numpy、matplotlib的使用

5.3 Python的科学计算包 - Numpy numpy(Numerical Python extensions)是一个第三方的Python包,用于科学计算.这个库的前身是1995年就开始开发的一个用于数组运算的库.经过了长时间的发展,基本上成了绝大部分Python科学计算的基础包,当然也包括所有提供Python接口的深度学习框架. numpy在Linux下的安装已经在5.1.2中作为例子讲过,Windows下也可以通过pip,或者到下面网址下载: Obtaining NumPy & Sci