jieba+wordcloud+imageio—自定义词云

import jiebaimport wordcloudfrom imageio import imreadmask=imread(‘fivestar.png‘)def shuchu():    txt=open(‘threekingdoms.txt‘,‘r‘,encoding=‘gb18030‘).read()    excludes={‘将军‘,‘却说‘,‘荆州‘,‘二人‘,‘不可‘,‘不能‘,‘如此‘}    words=jieba.lcut(txt)    counts={}    for word in words:        if len(word)==1:            continue        elif word==‘诸葛亮‘ or word==‘孔明曰‘:            rword=‘孔明‘        elif word==‘关公‘ or word==‘云长‘:            rword=‘关羽‘        elif word==‘玄德‘ or word==‘玄德曰‘:            rword=‘刘备‘        elif word==‘孟德‘ or word==‘丞相‘:            rword=‘曹操‘        else:            rword=word        counts[rword]=counts.get(rword,0)+1    for word in excludes:        del counts[word]    items = list(counts.items())    items.sort(key=lambda x:x[1],reverse=True)    for i in range(10):        word,count=items[i]        print(‘{0:<10}{1:>5}‘.format(word,count))shuchu()f=open(‘threekingdoms.txt‘,‘r‘,encoding=‘gb18030‘)t=f.read()f.close()ls=jieba.lcut(t)txt=‘ ‘.join(ls)w=wordcloud.WordCloud(font_path=‘msyh.ttc‘,width=1000,height=700,background_color=‘white‘,mask=mask)w.generate(txt)w.to_file(‘grwordcloud.png‘)

原文地址:https://www.cnblogs.com/Aluosen/p/11509480.html

时间: 2024-11-06 03:43:31

jieba+wordcloud+imageio—自定义词云的相关文章

自定义词云图片

导包 from imageio import imread import jieba from wordcloud import WordCloud 自定义文本 str = '小明硕士毕业于中国科学院计算所,后在日本京都大学深造' 从文件中导入文本 with open('文件名.txt', 'r', encoding='utf8') as f: str = f.read() 剩下代码如下 # 利用jieba将字符串转化为单个词语的列表 ret = jieba.lcut(str) # 根据 , s

jieba分词与worldcloud词云

中文分词的优秀库. 安装:pip install jieba 主要有三种模式,但是最主要有一个函数 模式:精确模式:把文本精确的切分开,不存在冗余单词 全模式:把文本中所有可能的词语都扫描出来,有冗余 搜索引擎模式:在精确模式上,对长词再次切分 函数:jieba.lcut(str):精确模式,返回一个列表 jieba.lcut(str,cut_all=True):就变成全模式,存在冗余 jieba.lcut_for_search(str):搜索引擎模式,返回列表,有冗余 jieba.add_wo

Python -WordCloud安装、词云制作

一.WordCloud 安装 说明:Windows系统直接pip install wordcloud 是不行的,命令行会报错. 第一步:检查自己的Python 版本.Win+R ——>CMD——>命令行输入python,我的是python 3.7 win32位的 第二步:下载对应版本的WordCloud,进入 python 扩展包库 (非正式第三方whl文件包)下载 第三步:安装.命令行先定位到下载的wordcloud安装文件路径,再输入 pip install wordcloud-1.6.0

词云wordcloud

pip install wordcloud 没有报错,如果有错误可以从http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud下载whl文件直接安装. # -*- coding: utf-8 -*- __author__ = 'leilu' #wordcloud生成中文词云 from wordcloud import WordCloud import codecs import jieba #import jieba.analyse as anal

python3 wordcloud词云

wordclou:根据文本生成词云 一.词云设置 1 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 2 margin=1, #字与字之间的距离 3 background_color='white',#背景颜色 4 min_font_size=3,max_font_size=None,#显示的最小,最大的字体大小 5 max_words=200,#显示的词的最大个数 6 ranks_only=None,#是否只是排名 7 pref

Matplotlib学习---用wordcloud画词云(Word Cloud)

画词云首先需要安装wordcloud(生成词云)和jieba(中文分词). 先来说说wordcloud的安装吧,真是一波三折.首先用pip install wordcloud出现错误,说需要安装Visual C++ 14.0.折腾半天安装好Visual C++后,还是不行,按网上指点,下载第三方包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud).安装是成功了,可是在anaconda里导入的时候又出现了问题,说是"no module

使用python绘制词云

最近在忙考试的事情,没什么时间敲代码,一个月也没几天看代码,最近看到可视化的词云,看到网上也很多这样的工具, 但是都不怎么完美,有些不支持中文,有的中文词频统计得莫名其妙.有的不支持自定义形状.所有的都不能自定义颜色 于是网上找了一下,决定用python绘制词云,主要用到的是wordcloud库,安装只需要pip isntall wordcloud就行, 数据用的是酒店评论的数据,代码如下: # -*- coding: utf-8 -*- import matplotlib.pyplot as

用Python玩转词云

第一步:引入相关的库包: #coding:utf-8 __author__ = 'Administrator' import jieba #分词包 import numpy #numpy计算包 import codecs #codecs提供的open方法来指定打开的文件的语言编码,它会在读取的时候自动转换为内部unicode import pandas import matplotlib.pyplot as plt %matplotlib inline from wordcloud import

python实现词云

一.安装使用命令[pip install wordcloud]安装词云 二.参数使用了OpenCV的数据格式进行读取,字体可以多试几种 def create_wordcloud_pic(): stopwords = get_noisy_word() # 噪声词以字典的形式进行呈现 img = cv2.imread(img_path) # 图片矩阵 font = r'C:\Windows\Fonts\simsun.ttc' # 字体 cloud = WordCloud( # 设置字体,不指定就会出