python数据分析与展示(二)

数据存取与函数

一、CSV文件

CSV(Comma-Separated Value,逗号分隔值),CSV是一种常见的文件格式,用来存储批量数据。

CSV文件只能有效存储一位和二维数组。

写入数组:

import numpy as np

np.savetxt(frame,array,fmt=‘%.18e‘,delimiter=None)

#   frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件
#   array:存入文件的数组
#   fmt:写入文件的格式,例如%d %.2f %.18e
#   delimiter:分割字符串,默认是任何空格

例子:

import numpy as np

a=np.arange(100).reshape((5,20))
np.savetxt(‘a.csv‘,a,fmt=‘%d‘,delimiter=‘,‘,header="实验数组",encoding=‘utf-8‘)
# 实验数组
0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19
20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39
40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59
60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79
80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99

读出数组:

import numpy as np

np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)

#   frame:文件、字符串或产生器,可以是.gz或.bz2的压缩文件
#   dtype:数据类型,可选
#   delimeter:分割字符串,默认是空格
#   unpack:如果True,读入属性分别写入不同变量

例子:

import numpy as np

a=np.loadtxt(‘a.csv‘,dtype=np.float,delimiter=‘,‘)
print(a)

‘‘‘
[[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10. 11. 12. 13. 14. 15. 16. 17.
  18. 19.]
 [20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37.
  38. 39.]
 [40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57.
  58. 59.]
 [60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77.
  78. 79.]
 [80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97.
  98. 99.]]
‘‘‘

二、多维数据的的存取

写入数组:

import numpy as np

np.tofile(frame,sep=‘‘,format=‘%s‘)

#   frame:文件、字符串
#   sep:数据分割字符串,如果是空串,写入文件为二进制
#   format:写入数据的格式

例子:

import numpy as np

a=np.arange(100).reshape((5,20))
a.tofile(‘a.dat‘,sep=‘,‘,format=‘%d‘)a.tofile(‘b.dat‘,format=‘%d‘)  #此时写入的是二进制格

读出数组:

np.fromfile(frame,dtype=float,count=-1,sep=‘‘)

#   frame:文件、字符串
#   dtype:读取的数据类型
#   count:读入元素的个数,-1表示读入整个文件
#   sep:数据分割字符串,如果是空串,写入文件为二进制

例子:

import numpy as np

a=np.fromfile(‘a.dat‘,dtype=np.int,sep=‘,‘).reshape((5,20))
print(a)
‘‘‘
[[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]
 [20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39]
 [40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59]
 [60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79]
 [80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99]]
‘‘‘

注意:该方法需要读取时知道存入文件时数组的维度和元素类型,a.tofile()和np.fromfile()需要配合使用,可以通过元数据文件来存储额外信息

三、多维数组的便捷文件存取

import numpy as np

np.save(fname,array)   #np.savez(frame,array)

#   fname:文件名,以.npy为扩展名,压缩扩展名为.npz
#   array:数组变量

np.load(fname)

#   fname:文件名,以.npy为扩展名,压缩扩展名为.npz

例子:

import numpy as np

a=np.arange(100).reshape((2,5,10))
np.save(‘a.npy‘,a)
a=np.load(‘a.npy‘)
print(a)
‘‘‘
[[[ 0  1  2  3  4  5  6  7  8  9]
  [10 11 12 13 14 15 16 17 18 19]
  [20 21 22 23 24 25 26 27 28 29]
  [30 31 32 33 34 35 36 37 38 39]
  [40 41 42 43 44 45 46 47 48 49]]

 [[50 51 52 53 54 55 56 57 58 59]
  [60 61 62 63 64 65 66 67 68 69]
  [70 71 72 73 74 75 76 77 78 79]
  [80 81 82 83 84 85 86 87 88 89]
  [90 91 92 93 94 95 96 97 98 99]]]
‘‘‘

四、NumPy的随机函数

NumPy的随机函数子库是random库

原文地址:https://www.cnblogs.com/BUPT-MrWu/p/11345757.html

时间: 2024-08-30 13:38:58

python数据分析与展示(二)的相关文章

Python数据分析与展示(1)-数据分析之表示(1)-NumPy数据存取与函数

NumPy数据存取与函数 数据的CSV文件存取 CSV文件 CSV(Comma-Separated Value,逗号分隔值) CSV是一种常见的文件格式,用来存储批量数据. 将数据写入CSV文件 np.savetxt(frame, array, fmt='%.18e', delimiter=None) -frame: 文件.字符串或产生器,可以是.gz或.bz2的压缩文件 -array: 存入文件的数组 -fmt: 写入文件的格式,例如:%d %.2f %.18e -delimiter:分割字符

Python数据分析--Pandas知识点(二)

本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) 下面将是在知识点一的基础上继续总结. 13. 简单计算 新建一个数据表df 1 import pandas as pd 2 3 df = pd.DataFrame({"地区": ["A区","B区", "C区"], 4 "前半年销量": [3500, 4500,3800], 5

Python数据分析与展示(二):数据分析与展示

数据的CSV文件存取: 1 np.savetxt(frame, array, fmt='%.18e', delimiter=None) 2 ? frame : 文件.字符串或产生器,可以是.gz或.bz2的压缩文件 3 ? array : 存入文件的数组 4 ? fmt : 写入文件的格式,例如:%d %.2f %.18e 5 ? delimiter : 分割字符串,默认是任何空格 1 np.loadtxt(frame, dtype=np.float, delimiter=None, unpac

python数据分析Numpy(二)

Numpy (Numerical Python) 高性能科学计算和数据分析的基础包: ndarray,多维数组(矩阵),具有矢量运算能力,快速.节省空间: 矩阵运算,无需循环,可以完成类似Matlab中的矢量运算: 线性代数.随机送生成: ndarray ,N维数组对象(矩阵) 所有元素必须是相同类型 ndim属性,维度个数 shape属性,各维度大小 dtype属性,数据类型 代码示例: import numpy # 生成指定维度的随机多维数据(两行三列) data = numpy.rando

Python数据分析与展示[第一周]

ipython 中的问号 获得相关的描述信息 %run 系统文件 执行某一个文件 ipython的模式命令 %magic 显示所有的魔术命令 %hist    命令历史输入信息 %pdb    异常发生后自动进入调试器 %reset  删除当前命名空间中的全部变量或名称 %who   显示Ipython 当前命名空间中的已经定义的变量 %time statemnent 给出代码执行时间 %timeit statement 多次实行代码,计算平均执行时间 基本读取数据的方法 维度:数据的组织形式

数据分析与展示——NumPy库入门

这是我学习北京理工大学嵩天老师的<Python数据分析与展示>课程的笔记.嵩老师的课程重点突出.层次分明,在这里特别感谢嵩老师的精彩讲解. NumPy库入门 数据的维度 维度是一组数据的组织形式.数据维度就是在数据之间形成特定关系表达多种含义的一个概念. 一维数据: 一维数据由对等关系的有序或无序数据构成,采用线性方式组织.对应列表.数组和集合等概念. 列表和数组:一组数据的有序结构. 区别: 列表:数据类型可以不同 数组:数据类型相同 二维数据: 二维数据由多个一维数据构成,是一维数据的组合

Python数据分析--Pandas知识点(三)

本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘. Python数据分析--Pandas知识点(一) Python数据分析--Pandas知识点(二) 下面将是在知识点一, 二的基础上继续总结. 前面所介绍的都是以表格的形式中展现数据, 下面将介绍Pandas与Matplotlib配合绘制出折线图, 散点图, 饼图, 柱形图, 直方图等五大基本图形. Matplotlib是python中的一个2D图形库, 它能以各种硬拷贝的格式和跨平台的交互式环境生成高质量的图形,

Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识

Python 数据分析(二) 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识 第1节 groupby 技术 第2节 数据聚合 第3节 分组级运算和转换 第4节 透视表和交叉表 第5节 时间序列 第6节 日期的规范.频率以及移动 第7节 时区处理 第8节 时期及算术运算 第9节 重采样及频率转换 第10节 时间序列绘图 groupby 技术 一.实验简介 Python 数据分析(二)需要同学们先行学完 Python 数据分析(一)的课程. 对数据集进行分

【python数据分析实战】电影票房数据分析(二)数据可视化

目录 图1 每年的月票房走势图 图2 年票房总值.上映影片总数及观影人次 图3 单片总票房及日均票房 图4 单片票房及上映月份关系图 在上一部分<[python数据分析实战]电影票房数据分析(一)数据采集> 已经获取到了2011年至今的票房数据,并保存在了mysql中. 本文将在实操中讲解如何将mysql中的数据抽取出来并做成动态可视化. 图1 每年的月票房走势图 第一张图,我们要看一下每月的票房走势,毫无疑问要做成折线图,将近10年的票房数据放在一张图上展示. 数据抽取: 采集到的票房数据是