R 语言词云wordcloud

来源:http://blog.chinaunix.net/uid-25135004-id-4311592.html

wordcloud函数--用于绘制词云图

用法:
wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE, random.color=FALSE, rot.per=.1,
colors="black",ordered.colors=FALSE,use.r.layout=FALSE,fixed.asp=TRUE, ...)

参数
 1)words --- 关键词列表
                   the words
 2)freq---关键词对应的词频列表
               their frequencies
 3)scale---显示字体大小的范围,例如c(3,0.3),最大字体是3,最小字体是0.3
               A vector of length 2 indicating the range of the size of the words
 4)min.freq---最小词频,低于最小词频的词不会被显示
                   words with frequency below min.freq will not be plotted
 5)max.words---显示的最大词数量。
                       Maximum number of words to be plotted. least frequent terms dropped
 6)random.order---词在图上的排列顺序。T:词随机排列;F:词按频数从图中心位置往外降序排列,即频数大的词出现在中心位置。
                           plot words in random order. If false, they will be plotted in decreasing frequency
 7)random.color---控制词的字体颜色。T:字体颜色随机分配;F:根据频数分配字体颜色。
                           choose colors randomly from the colors. If false, the color is chosen based on the frequency
 8)rot.per---控制词摆放角度。T:旋转90度;F:水平摆放。
                    proportion words with 90 degree rotation
 9)colors---字体颜色列表
                   color words from least to most frequent
 10)ordered.colors---控制字体颜色使用顺序。T:按照指定的顺序给出每个关键词字体颜色,(似乎是要求颜色列表中每个颜色一一对应关键词列表);F:任意给出字体颜色。
                                if true, then colors are assigned to words in order
 11)use.r.layout
                if false, then c++ code is used for collision detection, otherwise R is used
 12) fixed.asp 
               if TRUE, the aspect ratio is fixed. Variable aspect ratio only supported if rot.per==0
 13) ... 
             Additional parameters to be passed to text (and strheight,strwidth).

Details
If freq is missing, then words can either be a character vector, or Corpus. If it is a vector and freq is
missing, standard stop words will be removed prior to plotting.

安装:
install.packages(‘wordcloud‘)

例子:
wordcloud(c(letters, LETTERS, 0:9), seq(1, 1000, len = 62))

具体使用例子:

1、直接显示图像的例子

点击(此处)折叠或打开

  1. #加载wordcloud包
  2. library(wordcloud)
  3. #指定字体颜色范围  或者使用R颜色程序包中现成的主题模板 colors=brewer.pal(8,"Dark2")
  4. colors=c(‘red‘,‘blue‘,‘green‘,‘yellow‘,‘purple‘)
  5. #读取数据
  6. data=read.table("/root/words.xa",header = F)
  7. #显示图形
  8. wordcloud(data$V2,data$V1,scale=c(5,0.3),min.freq=-Inf,max.words=60,colors=colors,random.order=F,random.color=F,ordered.colors=F)

2、把图像保存为png

点击(此处)折叠或打开

  1. #设置保存图像的目录
  2. setwd("/tmp/")
  3. #设置保存图像的名字,背景颜色,宽度和高度
  4. png(file="wordcloud.png", bg="white",width = 480, height = 480)
  5. #加载wordcloud包
  6. library(wordcloud)
  7. #指定字体颜色范围 或者自定义颜色范围 colors=c(‘red‘,‘blue‘,‘green‘,‘yellow‘,‘purple‘)
  8. colors=brewer.pal(8,"Dark2")
  9. #读取数据
  10. data=read.table("/root/words.xa",header = F)
  11. #显示图形
  12. wordcloud(data$V2,data$V1,scale=c(5,0.3),min.freq=-Inf,max.words=60,colors=colors,random.order=F,random.color=F,ordered.colors=F)
  13. #结束符
  14. dev.off()
时间: 2024-10-09 06:25:17

R 语言词云wordcloud的相关文章

R语言中 fitted()和predict()的区别

fitted是拟合值,predict是预测值.模型是基于给定样本的值建立的,在这些给定样本上做预测就是拟合.在新样本上做预测就是预测. 你可以找一组数据试试,结果如何.fit<-lm(weight~height,data=women)fitted(fit) predict(fit,newdata=data.frame(height=90))##将90代入看结果如何这是R in action中的例子 R语言中 fitted()和predict()的区别,布布扣,bubuko.com R语言中 fi

R语言中apply函数

前言 刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算. 那么,这是为什么呢?原因在于R的循环操作for和while,都是基于R语言本身来实现的,而向量操作是基于底层的C语言函数实现的,从性能上来看,就会有比较明显的差距了.那么如何使用C的函数来实现向量计算呢,就是要用到apply的家族函数,包括apply, sapply, tapply, mapply, lapply, rapply, vapply, eapply等. 目录

大数据工具比较:R 语言和 Spark 谁更胜一筹?

本文有两重目的,一是在性能方面快速对比下R语言和Spark,二是想向大家介绍下Spark的机器学习库 背景介绍 由于R语言本身是单线程的,所以可能从性能方面对比Spark和R并不是很明智的做法.即使这种比较不是很理想,但是对于那些曾经遇到过这些问题的人,下文中的一些数字一定会让你很感兴趣. 你是否曾把一个机器学习的问题丢到R里运行,然后等上好几个小时?而仅仅是因为没有可行的替代方式,你只能耐心地等.所以是时候去看看Spark的机器学习了,它包含R语言大部分的功能,并且在数据转换和性能上优于R语言

词云wordcloud类介绍&amp;python制作词云图&amp;词云图乱码问题等小坑

词云图,大家一定见过,大数据时代大家经常见,我们今天就来用python的第三方库wordcloud,来制作一个大数据词云图,同时会降到这个过程中遇到的各种坑, 举个例子,下面是我从自己的微信上抓的微信好友签名,制作的词云图:看来用的做多的还是"方得始终"啊 首先我们需要几个库,pip完了导入 1 import chardet #检测字符类型的类 2 from wordcloud import WordCloud #词云库 3 import matplotlib.pyplot as pl

词云wordcloud

pip install wordcloud 没有报错,如果有错误可以从http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud下载whl文件直接安装. # -*- coding: utf-8 -*- __author__ = 'leilu' #wordcloud生成中文词云 from wordcloud import WordCloud import codecs import jieba #import jieba.analyse as anal

数据词云(wordcloud)

import pandas as pdimport numpy as npfrom pandas import Seriesfrom pandas import DataFramefrom wordcloud import WordCloud,ImageColorGeneratorimport matplotlib.pyplot as pltimport jiebafrom PIL import Image df =pd.read_csv('ZHILIAN_SPIDER.csv',header=

Python词云wordcloud模板

很简单: import wordcloud import jieba import time start=time.perf_counter() f=open('xyy.txt','r',encoding='gbk') #这里的编码格式还不太了解,有的用utf-8,有的用gbk t=f.read() f.close() ls=jieba.lcut(t) txt=' '.join(ls) w=wordcloud.WordCloud(font_path='msyh.ttc',width=1000,h

python pip安装加速以及安装词云 wordcloud报错解决方法

我们正常用pip直接下载的话,因为是国外的下载源,所以下载的东西还是很慢的,而一旦断了就是红字了. 所以我们可以切换到国内的pip源来下载. 对于Python开发用户来讲,PIP安装软件包是家常便饭.但国外的源下载速度实在太慢,浪费时间.而且经常出现下载后安装出错问题.所以把PIP安装源替换成国内镜像,可以大幅提升下载速度,还可以提高安装成功率 国内源: 新版ubuntu要求使用https源,要注意. 清华:https://pypi.tuna.tsinghua.edu.cn/simple 阿里云

Python - 利用词云wordcloud,jieba和中国地图制作四大名著的热词图

热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力.下面这段代码是制作热词图的,用到了以下技术: jieba,把文本分词 wordcloud,制作热图 chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容 imageio,提取图片的形状 其他:自动识别文件编码,自动识别txt文件,图片文件名与txt文件一致,使用的是四大名著的文本(自行百度),部分中国地图 上代码: import os import jieba import wordclou