R语言实战读书笔记2—创建数据集(下)

2.3 数据输入

2.3.1 使用键盘输入数据

2.3.2 从带分隔符的文本文件导入数据

可以使用 read.table() 从带分隔符的文本文件中导入数据。此函数可读入一个表格格式

的文件并将其保存为一个数据框。

其中， file 是一个带分隔符的ASCII文本文件， header 是一个表明首行是否包含了变量名的逻辑值（ TRUE 或 FALSE ）， sep 用来指定分隔数据的分隔符， row.names 是一个可选参数，用以指定一个或多个表示行标识符的变量。

2.3.3 导入Excel数据

读取一个Excel文件的最好方式，就是在Excel中将其导出为一个逗号分隔文件（csv），并使用前文描述的方式将其导入R中。

在Windows32位系统中，你也可以使用 RODBC 包来访问Excel文件。电子表格的第一行应当包含变量/列的名称。首先下载RODBC的包

这里的 myfile.xls 是一个Excel文件， mysheet 是要从这个工作簿中读取工作表的名称，channel 是一个由 odbcConnectExcel() 返回的 RODBC 连接对象， mydataframe 是返回的数据框。 RODBC 也可用于从Microsoft Access导入数据。

2.3.4 访问数据库管理系统

使用RODBC连接数据库，首先需要在电脑上注册数据库的ODBC数据源。

配置方法：控制面板--->管理工具--->数据源(ODBC)

2.4 数据导出

2.4.1导出到txt文本中

可以用 write.table() 函数将R对象输出到符号分隔文件中。

2.4.2 导出到csv文本中

2.4.3 导出到数据库中

2.5 处理数据对象的使用函数

时间： 2024-12-21 01:19:40

R语言实战读书笔记2—创建数据集(下)的相关文章

R语言实战读书笔记(二)创建数据集

2.2.2 矩阵 matrix(vector,nrow,ncol,byrow,dimnames,char_vector_rownames,char_vector_colnames) 其中: byrow=TRUE/FALSE,表示按行填充还是按列填充,默认情况下是按列填充 2.2.4 数据框 1.attach,detach()和with() attach():将数据框加入搜索路径 detach():将数据框移除出搜索路径 with():赋值仅在括号内有效,如果想在括号外生效也可以,用<<- 2.

R语言实战读书笔记2—创建数据集（上）

第二章创建数据集 2.1 数据集的概念不同的行业对于数据集的行和列叫法不同.统计学家称它们为观测(observation)和变量(variable) ,数据库分析师则称其为记录(record)和字段(field) ,数据挖掘/机器学习学科的研究者则把它们叫做示例(example)和属性(attribute) .如表2.1所示在表2-1所示的数据集中, PatientID 是行/实例标识符, AdmDate 是日期型变量, Age 是连续型变量, Diabetes 是名义型变量, Statu

R语言实战读书笔记(四)基本数据管理

4.2 创建新变量几个运算符: ^或**:求幂 x%%y:求余 x%/%y:整数除 4.3 变量的重编码 with(): within():可以修改数据框 4.4 变量重命名包reshape中有个函数rename,可以改名 rename(df,c(manage='managerID',date='testDate')) 或 names(df)[2]<-'newname' 4.5 缺失值 is.na():检查缺失值,是返回TRUE,否返回FALSE na.rm=TRUE选项可以用,比如 y<

R语言实战读书笔记1—语言介绍

第一章语言介绍 1.1 典型的数据分析步骤 1.2 获取帮助 help.start() help("which") help.search("which") 1.3 管理R工作区间函数 1.3 输入和输出 1.3.1 输入函数 source("filename") 可在当前会话中执行一个脚本.如果文件名中不包含路径,R将假设此脚本在当前工作目录中.举例来说, source("1.R") 将执行包含在文件1.R中的R语句集合

R语言实战读书笔记(五)高级数据管理

5.2.1 数据函数 abs: sqrt: ceiling:求不小于x的最小整数 floor:求不大于x的最大整数 trunc:向0的方向截取x中的整数部分 round:将x舍入为指定位的小数 signif:舍入为指定的有效数字位数 cos,sin,tan acos,asin,atan:反正弦,反余弦,反正切 cosh,sinh,tanh:双曲余弦,双曲正弦和双曲正切 acosh,asinh,atanh:反双曲余弦,反双曲正弦和反双曲正切 log(x,n):以n为底 log: log10: ex

R语言实战读书笔记(七)基本统计分析

summary() sapply(x,fun,options):对数据框或矩阵中的每一个向量进行统计 mean sd:标准差 var:方差 min: max: median: length: range: quantile: vars <- c("mpg", "hp", "wt")head(mtcars[vars]) summary(mtcars[vars]) mystats <- function(x, na.omit = FALS

R语言实战读书笔记(十三)广义线性模型

# 婚外情数据集 data(Affairs, package = "AER") summary(Affairs) table(Affairs$affairs) # 用二值变量,是或否 Affairs$ynaffair[Affairs$affairs > 0] <- 1 Affairs$ynaffair[Affairs$affairs == 0] <- 0 Affairs$ynaffair <- factor(Affairs$ynaffair, levels =

R语言实战复习笔记——记录细节

> with(mtcars,summary(mpg,disp)) Min. 1st Qu. Median Mean 3rd Qu. Max. 10.40 15.42 19.20 20.09 22.80 33.90 相当于attach 和detach > mydata=transform(mtcars,sumx=mpg+disp) 向数据框中添加新变量与mydsta$sumx相同 > View(mydata) 将弹出小框,进行数据查看 > within(leadership,{+ a

《时间序列分析及应用：R语言》读书笔记--第二章基本概念

本章介绍时间序列中的基本概念.特别地,介绍随机过程.均值.方差.协方差函数.平稳过程和自相关函数等概念. 2.1时间序列与随机过程关于随机过程的定义,本科上过相关课程,用的是<应用随机过程>清华林元烈老师的书.第1章第5节: 上面的定义比较清楚明白.按照本书上的说法,随机变量序列就是一个随机过程,换句话说,在每一个t时刻,所研究的量都是一个随机变量.随机过程完整的概率结构是由每个时刻的有限联合概率分布族决定的,幸运的是,联合分布中的大部分信息可以通过均值.方差和协方差等加以描述,而不用去直接

猜你喜欢

多重背包

//多重背包 void WKnapsack4(int *value, int* v, int *Num, int n, int V) { int d[100][100]; memset(d, 0, s ...

[读书笔记]抉擇:希拉蕊回憶錄

每個人在一生中都會面臨艱難的抉擇,有些人遇到的多一些.難一點.我們得平衡工作和家庭的需求,不論是要照顧生病的小孩或年邁的父母:要籌錢付大學學費:還是要想辦法找到理想工作,並想好萬一這工作丟了該怎麼辦? ...

PHP面向对象(OOP)编程完全教程

转自:http://blog.snsgou.com/post-41.html 面向对象编程(OOP)是我们编程的一项基本技能,PHP5对OOP提供了良好的支持.如何使用OOP的思想来进行PHP的高级编 ...

PHP 中call_user_func相关函数的使用

call_user_func 官方的解释是:把第一个参数作为回调函数(callback),并且将其余的参数作为回调函数的参数. 第一个参数可以是函数名,后面的均为作为该函数使用的参数. 1. call ...

WPF线程——Dispatcher

使用WPF开发时经常会遇上自己建立的线程需要更新界面UI内容,从而导致的跨线程问题. 异常内容: 异常类型:System.InvalidOperationException 异常描述: "S ...

Qt Quick

Qt是一个跨平台的图形用户界面的框架. Qt quick是Qt提供的一种高级用户界面工具包. 在Android等移动设备上,Qt quick应用默认使用OpenGL ES,渲染效率很高. Qt Cre ...

[0x01 用Python讲解数据结构与算法] 关于数据结构和算法还有编程

忍耐和坚持虽是痛苦的事情,但却能渐渐地为你带来好处. ——奥维德一.学习目标 · 回顾在计算机科学.编程和问题解决过程中的基本知识: · 理解“抽象”在问题解决过程中的重要作用: · 理解并实现抽象 ...

poj3414 Pots

Description You are given two pots, having the volume of A and B liters respectively. The following ...

JavaScript权威指南学习笔记之一

1.关于分号 javascript里面不强制使用分号来表示一行语句的结束,但是最好能够在写js之前,特别是在原有的js上面新增时,最好前置一个分号.避免这种情况发生: 2.JavaScript类型转 ...

使用windows Live Writer发布51CTO博客

总结一下在使用windows Live中发布博客文章遇到的问题: 1.先下载此客户端软件 http://down.51cto.com/data/2287041 下载完后,解压此压缩包,点击open l ...

类型参数化

第19章 queue函数队列 head:返回队列第一个元素:tail 返回除第一个元素之外的队列:append返回尾部添加了指定元素的新队列 class SlowAppendShow[T](elems ...

第二十三天笔记

黑马程序员 <a href="http://www.itheima.com" target="blank">java培训</a> 第二 ...

HDU 3652

和上题类似,但加上了一个条件要被13整除.可以想到要设三维.开始时设DP[I][J][K],直接设能否被13整除为一类,但转移不了... 可以设DP[I][J][K]令J为除13后的余数,I为位数,K ...

DateTime格式转换结果

Console.WriteLine(string.Format("ToLongDateString:{0}", DateTime.Now.ToLongDateString())); ...

Java基础知识强化之IO流笔记44：IO流练习之复制图片的 4 种方式案例

1. 复制图片的 4 种方式案例: 分析: 复制数据,如果我们知道用记事本打开并能够读懂,就用字符流,否则用字节流. 通过该原理,我们知道我们应该采用字节流. 而字节流有4种方式,所以做这个题目我们有 ...

usaco 数字接力

题目描述: 就是说给出188 转化为 64 24 8 结束直接模拟 #include<iostream> #include<cstdio> #include<cstr ...

amCharts 股票走势K线图金融图表控件下载及详细介绍

amCharts股票走势图的主要目的是为了显示金融图表控件,但它可以用于任何日期(时间)为基础的数据可视化. 股票走势图,是一个功能强大的应用程序,让你忘了最枯燥的部分构建复杂的统计系统.它具有内置的 ...

Android java.lang.IllegalArgumentException: Object returned from onCreateLoader must not be a non-static inn

AsyncTaskLoader: http://developer.Android.com/intl/zh-CN/reference/android/content/AsyncTaskLoader.h ...

Effective C++读书笔记(条款1-10)

不得不说,Effective C++确实是一本C++进阶的好书,刚浏览完第二遍, 现对其做一个大体性的总结 ,并进行适当的展开,作为以后C++参考复习之用. (一).让自己习惯C++ ________ ...

【转载】让你的MATLAB代码飞起来

原文地址:http://developer.51cto.com/art/201104/255128_all.htm MATLAB语言是一种被称为是"演算纸"式的语言,因此追求的是方 ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.