python第七周,二维数据的格式化和处理

二维数据的表示:

类表类型可以表示二维数据

[   [424,23423,2342],[131,535,3646]  ]

使用两层for循环可以便利每个元素

外层列表中每个元素可以对应一行,也可以对应一列

一维数据分为列表和集合类型,二维数据只有列表类型

CSV数据存储格式

国际通用的一二维数据存储格式,一般.csv扩展名,每行一个一维数据,采用逗号分隔,无空行

Excel软件可读入输出,一般编辑软件都可以产生,如果某个元素缺失,逗号仍要保留,

二维数据的表头可以作为数据存储,也可以另行存储,

一般索引习惯,ls[row][cokumn],先行后列

二维数据的处理:

从CSV格式的文件中读入数据

fo = open(fname)
ls = []
for line in fo:
    line = line.replace("\n","")
    ls.append(line.split(","))
fo.close()

二维数据的写入处理

ls = [[],[],[]]
f = open (fname,‘w‘)
for item in ls:
    f.write(‘,‘.join(item) + ‘\n‘)
f.close()

二维数据的逐一处理:

ls = [[],[],[]]
for row in ls:
    for column in row:
        print(ls[row][column])

wordcloud库的使用:

cmd 命令行:pip install wordcloud

wordcloud.WordCloud()代表一个文本对应的词云

wordcloud库常规方法

w=wordcloud.WordCloud()

方法 描述
w.generate(txt)
向对象w中加载文本txt,

>>>w.generate("afwawfawf")

w.to_file(filename)
将词云输出为图像文件,.png或.jpg

>>>w.to_file("outfile.png")

配置对象参数:

参数 描述
width
指定词云对象生成图片的宽度,默认400像素

>>>w = wordcloud.WordCloud(width=600)

height 高度,默认200
min_font_size 指定词云中字体的最小字号,默认4号
max_font_size 最大字号,根据高度自动调节
fount_step 指定词云中字体字号的步进间隔默认为1
fount_path
指定字体文件的路径,默认None

>>>w =wordcloud.WordCloud(font_path="msyh.ttc")

max_words 指定词云最大单词数量,默认20
stop_words 指定词云的排除词列表,
mask
指定词云形状,默认为长方形,需要引用imread()函数

>>>from scipy.misc import imread

>>>mk = imread("pic.png")

>>>w = wordcloud.WordCloud(mask=mk)

background_color 指定词云图片的背景颜色,默认为黑色

原文地址:https://www.cnblogs.com/mouzaisi/p/12177828.html

时间: 2024-10-09 03:27:27

python第七周,二维数据的格式化和处理的相关文章

TensorflowTutorial_二维数据构造简单CNN

使用二维数据构造简单卷积神经网络 觉得有用的话,欢迎一起讨论相互学习~Follow Me 图像和一些时序数据集都可以用二维数据的形式表现,我们此次使用随机分布的二位数据构造一个简单的CNN-网络卷积-最大池化-全连接 参考代码 # Implementing Different Layers # --------------------------------------- # # We will illustrate how to use different types # of layers

二维数据名作形参

之前帮同学调一个程序的时候遇到的,把二维数据改为全局变量,不通过参数传递就没问题了,否则程序崩溃. 细究一下,二维数据名用于形参时需要注意哪些方面. 测试程序如下: #include<stdio.h> #include<stdlib.h> void print1(int **a, int m, int n); void print2(int (*a)[2], int m, int n); int main() { int a[2][2]={1,2,3,4}; print1((int

对二维数据进行边界拓展

对二维数据处理的时候,经常遇到需要越界的问题,比如对图像进行滤波操作.对原始数据的边界进行拓展,然后使用拓展后的数据作处理,可以解决越界的问题.根据拓展出的数据的值来自哪里可以分为多种边界拓展方式,我们要实现的是将边界进行奇对称拓展. 算法 举例说明什么是奇拓展.比如对原始二维数据向左拓展4列,那么在边界上向左第一列复制边界上向右第一列,在边界上向左第二列复制边界上向右第二列,以此类推.边界列并没有被复制,因为C语言中是从0开始计数的,所以边界列是0列,按照0列对称拓展就称为奇对称拓展.如果0列

python生成带参数二维码

#coding:utf8 import urllib2 import urllib import json import string import random class WebChat(object): def __init__(self, appid=None, secret=None, code=None): self.appid = appid self.secret = secret self.code = code def token_url(self): return "htt

14周(二维数组姓名成绩排序)

/* *copyright(c) 2014,烟台大学计算机学院 *All rights reserved. *文件名称:14周(二维数组姓名成绩排序) *作者:王忠 *完成日期:2014.12.01 *版本号:v1.0 * *问题描述:初始化同学的成绩,姓氏,按大小排序 *输入描述:无 *程序输出:按照姓名或者成绩大小排序并输出 #include <iostream> #include <string> using namespace std; const int num=8; i

14周(二维数组成绩姓名排序)

/* *copyright(c) 2014,烟台大学计算机学院 *All rights reserved. *文件名称:14周(二维数组成绩姓名排序) *作者:王忠 *完成日期:2014.12.01 *版本号:v1.0 * *问题描述:初始化同学的成绩,姓氏,按大小排序 *输入描述:无 *程序输出:按照姓名或者成绩大小排序并输出 #include <iostream> #include <string> using namespace std; const int num=8; i

【Excle数据透视】二维数据如何创建数据透视表

二维数据在创建数据透视表的时候,可能会给你带来一些麻烦,没法创建,会丢失维度,那怎么办呢? 解决办法:使用数据透视表和数据透视图向导即可创建 步骤1 按下[Alt+D+P],出现如下界面 选择上图中的"多重合并计算数据区域"→下一步 创建单页字段→下一步 选定区域A:A15→添加→下一步 单击完成 数据透视表已经创建完成.二维数据透视表与一维数据透视表在于"行合计" 注意:我上图的数据透视是使用默认计数,所以全部都是1,这个可以根据自己的需求进行调整.

PHP二维数据排序,二维数据模糊查询

一.因为项目中的一个报表需要合并三个表的数据,所以分表查询再合并数据,利用PHP数组函数进行排序,搜索.三表合并后的数组结构如下: Array ( [0] => Array ( [history_id] => 12 [sla_group_id] => 1 [sla_id] => -1 [create_time] => 1513057695 [tasklog_id] => 12 [tasklog_time] => 2017-12-12 13:48:15 [taskl

一维数据和二维数据

此文章为本人学习所得,如有不足之处,欢迎指正,分享原创,一起进步 维度:数据的组织形式 一维数据 由对等关系的有序或无序数据构成,采用线性方式(一条直线排开)组织 对等关系:这些数据平级关系(不是包含.从属关系) 一维数据的表示----- 如果数据间有序:使用列表类型.如:一维列表ls = [3.1 , 3.02 , 4.15]如果数据间无序:使用集合类型,如:一维集合st ={ 4.15 , 3.02 , 3.1} 切记:for循环可以遍历数据,进而对每个数据进行处理 一维数据的存储-----