用Python词云展示周董唱过的歌,发现内含秘密

马上开始了,你准备好了么

准备工作

环境:Windows + Python3.6

IDE:根据个人喜好,自行选择

模块:

Matplotlib是一个 Python 的 2D数学绘图库

1 pip install matplotlib
2 import matplotlib.pyplot as plt

jieba中文分词库

1 pip install jieba
2 import jieba

wordcloud词云库

1 pip install wordcloud
2 from wordcloud import WordCloud

实战具体步骤:

1、读入txt文本数据。

2、结巴中文分词,生成字符串默认精确模式,如果不通过分词,无法直接生成正确的中文词云。

3、生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库。

(无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode=‘RGBA‘和colormap=‘pink‘)

4、显示图片。

总体而言只有四个步骤还是比较简单的那咱们先看一下实现的效果图吧!

看到效果图后发现里面的秘密没?

完整代码

 1 # Matplotlib是一个 Python 的 2D数学绘图库
 2 # 安装:pip install matplotlib
 3 import matplotlib.pyplot as plt
 4 # jieba中文分词库
 5 # 安装:pip install jieba
 6 import jieba
 7 # wordcloud词云库
 8 # 安装pip install wordcloud
 9 from wordcloud import WordCloud
10
11 # 1.读入txt文本数据
12 text = open(r‘.\jay.txt‘, "r").read()
13 #print(text)
14
15 # 2.结巴中文分词,生成字符串,默认精确模式,如果不通过分词,无法直接生成正确的中文词云
16 cut_text = jieba.cut(text)
17 # print(type(cut_text))
18 # print(next(cut_text))
19 # print(next(cut_text))
20 # print(next(cut_text))
21 # 必须给个符号分隔开分词结果来形成字符串,否则不能绘制词云
22 result = " ".join(cut_text)
23 #print(result)
24
25 # 3.生成词云图,这里需要注意的是WordCloud默认不支持中文,所以这里需已下载好的中文字库
26 # 无自定义背景图:需要指定生成词云图的像素大小,默认背景颜色为黑色,统一文字颜色:mode=‘RGBA‘和colormap=‘pink‘
27 wc = WordCloud(
28         # 设置字体,不指定就会出现乱码
29         font_path=r‘.\simhei.ttf‘,
30         # 设置背景色
31         background_color=‘white‘,
32         # 设置背景宽
33         width=500,
34         # 设置背景高
35         height=350,
36         # 最大字体
37         max_font_size=50,
38         # 最小字体
39         min_font_size=10,
40                )  # max_words=1000 ),mode=‘RGBA‘,colormap=‘pink‘)
41 # 产生词云
42 wc.generate(result)
43 # 保存图片
44 wc.to_file(r".\wordcloud.png")  # 按照设置的像素宽高度保存绘制好的词云图,比下面程序显示更清晰
45
46 # 4.显示图片
47 # 指定所绘图名称
48 plt.figure("jay")
49 # 以图片的形式显示词云
50 plt.imshow(wc)
51 # 关闭图像坐标系
52 plt.axis("off")
53 plt.show()
54 print(‘Python学习交流群:125240963,群内每天分享干货,包括最新的python企业案例学习资料和零基础入门教程,欢迎各位小伙伴入群学习交流‘)

原文地址:https://www.cnblogs.com/Python6359/p/9147833.html

时间: 2024-11-10 09:23:33

用Python词云展示周董唱过的歌,发现内含秘密的相关文章

python 爬取豆瓣电影评论,并进行词云展示及出现的问题解决办法

本文旨在提供爬取豆瓣电影<我不是药神>评论和词云展示的代码样例 1.分析URL 2.爬取前10页评论 3.进行词云展示 1.分析URL 我不是药神 短评 第一页url https://movie.douban.com/subject/26752088/comments?start=0&limit=20&sort=new_score&status=P 第二页url https://movie.douban.com/subject/26752088/comments?sta

用Python爬虫对豆瓣《敦刻尔克》影评进行词云展示

最近很想看的一个电影,去知乎上看一下评论,刚好在学Python爬虫,就做个小实例. 代码基于第三方修改 原文链接  http://python.jobbole.com/88325/#comment-94754 #coding:utf-8 from lib2to3.pgen2.grammar import line __author__ = 'hang' import warnings warnings.filterwarnings("ignore") import jieba #分词包

爬取网易云音乐评论并使用词云展示

最近听到一首很喜欢的歌,许薇的<我以为>,评论也很有趣,遂有想爬取该歌曲下的所有评论并用词云工具展示. 我们使用chrome开发者工具,发现歌曲的评论都隐藏在以 R_SO_4 开头的 XHR 文件中 接下来思路就很明确,拿到该文件,解析该文件的 json 数据,拿到全部评论. 我们可以看到该文件有两个用JS加密的参数 params 和 encSecKey ,关于这两个加密参数,参考了知乎用户的解答:https://www.zhihu.com/question/36081767 . 步骤: 1.

Python 词云

穿过长长的县道,便是雪国. 在看黄杏元的GIS书籍,按照图论中用相邻矩阵来表示图是应该和书上一样全写出来的.但在寻找最短路径时候只用到了第一行向量,所以分析过程就简化了. 之后考虑会使用Python或者C++来实现一个简单图的Dijkstra算法,目前只是计划,具体什么时候写看时间吧. import wordcloud import jieba import numpy as np from PIL import Image import matplotlib.pyplot as plt txt

cvpr论文爬取——热词云展示(WEB)

效果图: Python源码(将数据导入数据库): 1 import re 2 import requests 3 import pymysql 4 5 def insertCvpr(value): 6 db = pymysql.connect("localhost", "root", "root", "cvprlist", charset='utf8') # 连接数据库 7 8 cursor = db.cursor() 9 s

[python] 词云:wordcloud包的安装、使用、原理(源码分析)、中文词云生成、代码重写

词云,又称文字云.标签云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思.常见于博客.微博.文章分析等. 除了网上现成的Wordle.Tagxedo.Tagul.Tagcrowd等词云制作工具,在python中也可以用wordcloud包比较轻松地实现(官网.github项目): from wordcloud import WordCloud import matplotlib.pyplot as pl

二级Python词云包安装问题

前言 二级Python第10章<第三方库概览>中介绍了三个库: PyInstaller Jieba WordCloud其中,前两个库是必须掌握的,第三个库是可选学习.因此,编程题中肯定不会出现对于词云库WordCloud的考察要求.但是,从实际应用开发角度讲,这个库是学习时下Python大数据编程必须要掌握的--当然也是比较简单的. 安装问题 在安装WordCloud过程中遇到失败与成功,特别记录于下. 家中机器上的失败安装 遗憾的是,家中笔记本上安装的是WINDOWS 7 32位,且费了很多

Python词云的中文问题

1 image= Image.open('F:/__identity/course/建模/九寨沟地震/四川地图.jpg') 2 fig = plt.figure(figsize=(20, 16)) 3 graph = np.array(image) 4 wc = WordCloud(font_path='./fonts/simhei.ttf',background_color='White',mask=graph) # font_path='./fonts/simhei.ttf' 显示中文 5

Python 词云 【中/英】小白简单入门教程

1. 分析 构建词云需要具备: 原料即文章等内容 将内容进行分词 将分词后的内容利用构建词云的工具进行构建 保存成图片 2. 需要的主要模块 jieba 中文分词 wordcloud 构建词云 3. 模块原理 wordcloud的实现原理 文本预处理 词频统计 将高频词以图片形式进行彩色渲染 jieba的实现原理 进行中文分词(有多种模式)[详情] 4. 英文词云 英文分词和构建词云只需要wordcloud模块 具体实现如下: 1 from wordcloud import WordCloud