哪怕你不认可,我还是要为R语言正名

有些业界从业人士对R语言的价值并不认可,他们认为R语言只针对统计分析。R语言的确提供了很全面的统计分析的软件包,比如CRAN,Bioconductor,Neuroconductor,以及ROpenSci;并且提供了优秀的包管理功能。

加米谷教育请添加链接描述告诉你在与计算机领域朋友的沟通中得知,R语言其实已经成长为一种多功能的编程语言,它的功能远不限于数据分析而已。但是,R语言的很多优秀特性并不为R语言社区以外的人所熟知。

在本文中,我将给大家介绍那些不为人知,却又好用到难以置信的R语言功能。

1. R的标记语言可以制作可重复生成的Word和Powerpoint文档

R语言中的rmarkdown包可以制作可重复生成的Word文档和Powerpoint幻灯片,而这只需要改变一行YAML的代码。

2. 组建和运行一个可交互的网络应用只需要几行代码

几行R代码就可以生成一个可交互的网络应用。比方说如果使用R语言的flexdashboard包, 你只需要36行代码,就可以生成一个可交互的动态报表,来探索你的BMI指数与全国健康营养检查样本结果的关联。

3. 几行甚至一行R代码就可以支持网络应用的运行

另外一个很酷的功能是,通过rsconnect包,R语言还可以仅用一两行代码就支持网络应用的运行。这些应用既可以通过自己的服务器来支持,也可以用shinyapps.io这种云服务器。

4. 通过使用R语言的dplyr/dbplyr,几乎各种数据库都可以连接

使用dbplyr包,用R语言连接各种数据库,无论是本地的还是远程的,都非常方便。这个功能使R语言用户可以不用担心底层的数据库,而独立地从主流数据库中抽取数据。R语言的bigrquery包还可以直接利用BigQuery和其他大规模数据存储。

5. 本地或多个不同的数据存储,在R语言里可以利用相同的dblyr语法来操作

当你学会如何利用dplyr来转换数据,本地和远程的数据库、数据存储都可以利用相同的代码来操作。这个功能简化了也统一化了操作多个数据库和数据语言的过程。

6. 你可以用Keras和Tensorflow训练深度学习模型

使用keras包或TensorFlow接口,你可以利用R语言来学习预训练或者开发全新的深度学习模型。

7. R语言可以编写和支持应用程序接口(API)

Plumbr包可以把R函数直接转换成网络应用接口(API),并能很方便的集成到下游应用中去。如果你还安装有Rstuodio Connect,这些函数可以像网络应用一样轻松地被部署。

8. 你可以使用R语言来生成电子游戏的界面

不仅是网络应用,R语言甚至可以生成电子游戏的界面。nessy 包可以帮助你生成并部署NES风格的Shiny应用。

  1. 你可以直接通过R语言调用Spark集群来分析数据

你想用大规模数据训练又大又复杂的机器学习模型么?R语言的sparklyr包帮助你在单机或者大型的Spark集群上直接完成这项任务。

  1. 你可以在R语言中以交互的方式学习R

R语言的swirl包可以用来生成可交互的R语言学习教程。

本文介绍了十个R语言中的功能,这些当然不是R语言全部的优秀特征。那些歧视R语言的同学你们是不是应该好好正视一下它的价值呢!当然来加米谷找我学R语言我也是肯定欢迎的

原文地址:https://blog.51cto.com/14284582/2380550

时间: 2024-11-09 00:00:13

哪怕你不认可,我还是要为R语言正名的相关文章

SQL Server 2016五大优势挖掘企业用户数据价值

转载自:http://soft.zdnet.com.cn/software_zone/2016/0318/3074442.shtml 3月10日,微软公司在美国纽约举办了一场名为“Data Driven”的活动,正式发布了新一代SQL Server 2016, 与此同时,还附赠了两条爆炸性消息:微软将SQL Server 2016开放给linux,同时还发布了一款针对Oracle数据库的迁移工具,以及相关的迁移优惠政策. 业内对这两条消息进行了各种各样的猜想和推测. 一周后,SQL Server

黄洁:Intel Spark应用优化和实践经验

摘要:黄洁就Spark的内存管理.IO提升和计算优化3个方面进行了详细讲解.黄洁表示,对比MapReduce,Spark擅长于复杂的机器学和图的计算.流处理等多种业务场景. [编者按]干货满满的2015 OpenStack技术大会.2015 Spark技术峰会.2015 Container技术峰会以实力赢得所有观众的认可.在Spark峰会上,英特尔大数据技术中心研发经理黄洁就Spark的内存管理.IO提升和计算优化3个方面进行了详细讲解,以下为演讲概述. 下为演讲概述 我来自Intel大数据技术

基于数据分析的评分系统改进

现代互联网组织愈发依赖数据,收集反馈,以正确有效的决策. 本文以软件工程师的绩效考核为例,展现了如何通过数据分析,调整和改进量化的评分系统. 业务问题: 基于360度绩效考核方法,现代组织会设计问卷调查表,请被考核员工的同事客户针对多个问题进行打分,以得到该员工量化的绩效结果. 在实践中,这套方法遇到两个问题: 问卷调查问题的设计是否合理: 理想中,每个问题都应该相互独立,也就是问题1的结果不会对问题2造成影响.问卷表很难在第一个版本中就设计完备,设计问题本身也是一个基于反馈分析的迭代过程. 有

为什么选择Scala,它在大数据处理方面有何优势?

近年来,关于大数据讨论已然是热火朝天,虽不说是家喻户晓,那至少对于业界来说也是引起了轩然大波.作为学生党的我,最近也在研究关于大数据的东东.作为一个技术迷,总是会想尝试一些新鲜的东西.前一段时间学习了Hadoop之后,又想看看Spark是什么东东.那么在这里有必要八卦一下Spark了. Spark是发源于美国加州大学伯克利分校AMPLab的集群计算平台.它立足于内存计算,从多迭代批量处理出发,兼收并蓄数据仓库.流处理和图计算等多种计算范式,是罕见的全能选手.就大数据集而言,对典型的迭代机器 学习

R You Ready?——大数据时代下优雅、卓越的统计分析及绘图环境

作者按:本文根据去年11月份CSDN举办的“大数据技术大会”演讲材料整理,最初发表于2012年2月期<程序员>杂志. 1. 历史 R(R Development Core Team, 2011)语言由新西兰奥克兰大学的 Ross Ihaka 和 Robert Gentleman 两人共同发明,其词法和语法分别源自 Scheme 和 S 语言,R 语言一般认为是 S 语言(John Chambers, Bell Labs, 1972)的一种方言.R 是“GNU S”, 一个自由的.有效的.用于统

程序员1月书讯

12月书讯中奖名单: xu_chenyang<精简:无印良品与品牌理念打造> 松阳<通关!游戏设计之道(第2版)> xiaerwoailuo<Python科学计算基础教程> SunnyYoona<数据架构:大数据.数据仓库以及Data Vault> 丁国华<设计的细节:日本经典设计透析> 好书推荐,在图灵书讯中选出你认为值得推荐的好书加推荐理由或推荐语,在文末评论里回复.下期书讯更新时,会在本期的书讯评论中选出若干优秀评论,获奖者可任选图灵书讯中

一个全基因组重测序分析实战

Original 2017-06-08 曾健明 生信技能树 这里选取的是 GATK best practice 是目前认可度最高的全基因组重测序分析流程,尤其适用于 人类研究. PS:其实本文应该属于直播我的基因组系列,有两个原因把它单独拿出来, 首先,直播我的基因组阅读量太低了,可能是大家觉得错过了前面的,后面的看起来没有必要,这里我可以肯定的告诉大家,这一讲是独立的,而且是全流程,你学好了这个,整个直播我的基因组就可以不用看了. 其次,最近有一些朋友写了一些GATK的教程,但是大多不合我意,

机器学习资料与攻略超强整理吐血推荐(二)

在前文<机器学习资料与攻略超强整理吐血推荐(一)>中,我们讲到要进入人工智能的圈子,数学是不可逾越的第一关,然后我们又推荐了一些你必须掌握的数学方面的资料.接下来,在这一篇中,我们将介绍关于机器学习的理论与工具方面的资料. 二.工具篇 工欲善其事,必先利其器.大数据时代,人工智能的工具趋势是显而易见且确定无疑的.作为一名数据科学家,其实你可以选择的工具非常多,其实随着时代的发展和技术的演进,传统的SPSS.STATA和SAS等这些老牌数据分析工具都已经集成了机器学习和数据挖掘的模块.当然,这不

[转载] 学习新技能的37个最佳网站

原文: http://codecloud.net/the-37-best-websites-to-learn-something-new-4772.html 大部分都是英文课程, 对英文要求较高, 有需求的时候查询吧. 忘了过于褒奖的学校.整天呆在拥挤的教室而效果却差得可怜.这些网站和应用涵盖了科学.艺术和技术的无数话题.它们可以教会你实践练习任何技能,从制作豆沙到用 node.js 开发 app,而且它们都是免费的.你绝对没有任何理由不去掌握一个新技能.拓展你的知识,或最终助长你的职业发展.你