R语言适配问题集锦

画图时的中文乱码问题

我这是Mac Yousemite 10.10.5，在两个地方遇到了中文乱码

1、使用wordcloud包绘制中文标签云时。

library(wordcloud)
mydata <- read.csv(‘word-count.txt‘,header=T,stringsAsFactors=F)
jpeg(filename=‘wordcloud.jpg‘, width=800,height=800,units=‘px‘)
mycolor <- colorRampPalette(c("gray", "red"))(200)
par(family=‘STKaiti‘)#解决方式是加上这一句。

关于详细的字体名称，能够通过这个命令查看：fc-list :lang=zh-cn
wordcloud(mydata$name,mydata$count,c(6,0.8),random.order=FALSE,color=mycolor)
dev.off()

2、使用igraph绘制社交关系图时

library(igraph)
#读取数据，注意编码格式是utf-8
singer <- read.csv(‘singers.txt‘, head=T,fileEncoding=‘UTF-8‘,encoding=‘UTF-8‘,stringsAsFactors=F)
#载入数据框
#g <- graph_from_data_frame(singer,directed=TRUE)
g <- graph.data.frame(singer,directed=TRUE)
#生成图片，大小是800*800px
jpeg(filename=‘singers.jpg‘,width=800,height=800,units=‘px‘)
par(family=‘STKaiti‘)#这里设置main属性的中文字体。以免其出现中文乱码。
plot(g,
    vertex.size=5,     #节点大小
    layout=layout.fruchterman.reingold,  #布局方式
    vertex.shape=‘none‘,    #不带边框
    vertex.label.cex=1.5,    #节点字体大小
    vertex.label.color=‘red‘,  #节点字体颜色
    vertex.label.font=4,
    main=‘歌星关系图谱‘,
    vertex.label.family=‘STKaiti‘,#这里设置每一个vertex节点的中文字体，以免其出现中文乱码。
    edge.arrow.size=0.7)    #连线的箭头的大小
#关闭图形设备。将缓冲区中的数据写入文件
dev.off()

3、读取本地文件时，本地文件务必使用UTF-8存储。

由于R内部的默认编码就是UTF-8

时间： 2024-08-13 07:02:39

R语言适配问题集锦的相关文章

《美团 R 语言数据运营实战》

美团 R 语言数据运营实战 2018年08月02日作者: 喻灿刘强文章链接 3689字 8分钟阅读一.引言近年来,随着分布式数据处理技术的不断革新,Hive.Spark.Kylin.Impala.Presto 等工具不断推陈出新,对大数据集合的计算和存储成为现实,数据仓库/商业分析部门日益成为各类企业和机构的标配.在这种背景下,是否能探索和挖掘数据价值,具备精细化数据运营的能力,就成为判定一个数据团队成功与否的关键. 在数据从后台走向前台的过程中,数据展示是最后一步关键环节.与冰冷的表

使用R语言计算均值，方差等

R语言对于数值计算很方便,最近用到了计算方差,标准差的功能,特记录. 数据准备 height <- c(6.00, 5.92, 5.58, 5.92) 1 计算均值 mean(height) [1] 5.855 2 计算中位数 median(height) [1] 5.92 3 计算标准差 sd(height) [1] 0.1871719 4 计算方差 var(height) [1] 0.03503333 5 计算两个变量之间的相关系数 cor(height,log(height)) [1] 0

R语言快速上手入门

R语言快速上手入门课程学习网址:http://www.xuetuwuyou.com/course/196 课程出自学途无忧网:http://www.xuetuwuyou.com 课程简介本教程深入浅出地讲解如何使用R语言玩转数据.课程中涵盖R语言编程的方方面面,内容涉及R对象的类型.R的记号体系和环境系统.自定义函数.if else语句.for循环.S3类R的包系统以及调试工具等.本课程还通过示例演示如何进行向量化编程,从而对代码进行提速并尽可能地发挥R的潜能.本课程适合立志成为数据科学家的

R语言学习-词频分析

概念 1.语料库-Corpus 语料库是我们要分析的所有文档的集合,就是需要为哪些文档来做词频 2.中文分词-Chinese Word Segmentation 指的是将一个汉字序列切分成一个一个单独的词语. 3.停用词-Stop Words 数据处理的时候,自动过滤掉某些字或词,包括泛滥的词如Web.网站等,又如语气助词如的.地.得等. 需要加载的包 1.tm包安装方式:install.packages("tm") 语料库: Corpus(x,readerControl) x-语料

R语言使用机器学习算法预测股票市场

quantmod 介绍 quantmod 是一个非常强大的金融分析报, 包含数据抓取,清洗,建模等等功能. 1. 获取数据 getSymbols 默认是数据源是yahoo 获取上交所股票为 getSymbols("600030.ss"), 深交所为 getSymbols("000002.sz"). ss表示上交所, sz表示深交所 2. 重命名函数 setSymbolLookup 3. 股息函数 getDividends 4. 除息调整函数 adjustOHLC

R语言数据挖掘实战系列（2）

二.R语言简介 R语言是一种为统计计算和图形显示而设计的语言环境,具有免费.多平台支持,同时可以从各种类型的数据源中导入数据,具有较高的开放性以及高水准的制图功能.R是一个体系庞大的应用软件,主要包括核心的R标准包和各专业领域的其他包.R在数据分析.数据挖掘领域具有特别优势. R安装 R可在其主页(https://www.r-project.org/)上获得,根据所选择的平台进行下载安装.安装完成之后启动R.为了方便使用R,可使用免费的图形界面编辑器RStudio,可从https://www.r

survival analysis 生存分析与R 语言示例入门篇

生存分析,survival analysis,顾名思义是用来研究个体的存活概率与时间的关系.例如研究病人感染了病毒后,多长时间会死亡:工作的机器多长时间会发生崩溃等. 这里“个体的存活”可以推广抽象成某些关注的事件. 所以SA就成了研究某一事件与它的发生时间的联系的方法.这个方法广泛的用在医学.生物学等学科上,近年来也越来越多人用在互联网数据挖掘中,例如用survival analysis去预测信息在社交网络的传播程度,或者去预测用户流失的概率. R里面有很成熟的SA工具. 本文介绍生存分析的

用蒙特卡洛方法计算派－python和R语言

用蒙特卡洛方法算pi-基于python和R语言最近follow了MOOC上一门python课,开始学Python.同时,买来了概率论与数理统计,准备自学一下统计.(因为被鄙视过不是统计专业却想搞数据分析) 有趣的是书里面有一块讲蒲丰投针计算Pi,这是一种随机模拟法,也就是蒙特卡洛法.蒲丰投针之于我太难,暂时没想到怎么用计算机模拟这一过程. python课中,老师也提到用随机模拟法,也就是蒙特卡洛法(MonteCarlo),用计算机模拟几千次实验,计算pi的近似值.好巧. 就拿python课中的

R语言学习资源

入门视频教程 R语言初级课程(1)- R语言快速入门http://cos.name/videos/intro-2-r/ 代码 #对象 1+1*3 c(1,2,3,4,5) c('helloworld','i am a R user') c("hehe","haha") 1:6 6:1 exp(1:4) log(1:3) a<-c(1,2,3,4,5) a[1] a[1:3] a[-4] a>3 a[a>3] #数组,类型需要一致 x<-1:1