R的学习(三)

一、均值

1.均值:mean(X)#计算所有元素的均值,包括矩阵、向量

2.行均值:apply(x,1,mean)

3.行均值:apply(x,2,mean)

注:如果x是数据框,则返回的就是向量

ex:mean(as.data.frame(x))

在做多元数据分析时,多元数据输入最好使用数据框的方式输入

4.在计算中某些数据是异常的,参数trim可以减少输入误差对计算的影响

ex:w.mean<-mean(w,trim=0.1)

0.1表示计算均值前需要去掉异常值的比例

5.有缺失值的时候无法计算均值,加上参数na.rm=TRUE可以计算有缺失值的均值

ex:w.mean<-mean(w.na,na.rm=TRUE);w.mean

6.加权向量

weight.mean(x,w,na.rm=TRUE)

x:数值向量

w:权值

二、顺序统计量

1.顺序排序

sort(x)

2.更广泛的功能

格式:sort(x,partial=NULL,na.last=NA,decreasing=FALSE,method=c("shell","quick"),index.return=FALSE)

partial:部分排序的指标向量

na.last:=NULL:不处理缺失数据;=FALSE缺失数据排在最后面;=TRUE缺失数据排在最前面

method:选择排序的方法。shell排序的复杂度为N的4/3次方,quick是快速排序

index.return:逻辑变量,TRUE为返回排序下标及排序结果,缺省为FASLE

decreasing:为TRUE时排序从大到小

三、中位数

中位数描述的是数据中心位置的数字特征,大体上比中位数或大或小的数据个数占整个数据的一半,对称分布的数据均值与中位数比较接近,偏态分布均值与中位数不同,中位数不受异常值的影响,具有稳健性

median(x,na.rm=TRUE):计算向量x的中位数,可处理有缺失值的数据

四:百分位数

quantile(x,probs=seq(0,1,0,25),na.rm=FASLE,names=TRUE,type=7,...)

probs:分位位置

五:方差、标准差、变异系数

变异系数是刻画数据相对分散性的一种度量记为CV=100*(s/x~)(%),x~为均值

方差:var(x)

标准差:sd(x)

协方差:cov(x)

相关矩阵:cor(x)

变异系数:cv=100*sd(x)/mean(x);cv

校正平方和:css=sum((w-mean(w))^2);css

未校正平方和:uss=sum(w^2);uss

样本极差:R=max(x)-min(x);R

样本标准误:sm=sd(x)/sqrt(length(x))

样本偏度系数:g1=n/((n-1)*(n-2))*sum((x-m)^3)/(sd(x))^3

样本峰度系数:g2=(n*(n+1))/((n-1)*(n-2)*(n-3))*sum((x-m)^4)/s^4-(3*(n-1)^2)/((n-2)*(n-3))#s=sd(x)

时间: 2024-10-25 19:51:56

R的学习(三)的相关文章

R语言学习笔记

參考:W.N. Venables, D.M. Smith and the R DCT: Introduction to R -- Notes on R: A Programming Environment for Data Analysis and Graphics,2003. http://bayes.math.montana.edu/Rweb/Rnotes/R.html 前言:关于R 在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data

R语言学习(5)-字符串和因子

字符串和因子 1.字符串 创建字符串 > c("HELLO","WORLD") [1] "HELLO" "WORLD" 使用paste函数连接字符串 > paste(c("hello","hi"),"world") [1] "hello world" "hi world" > paste(c("hel

Jquery Easy UI初步学习(三)数据增删改

第二篇只是学了加载用datagrid加载数据,数据的增删改还没有做,今天主要是解决这个问题了. 在做增删改前需要弹出对应窗口,这就需要了解一下EasyUi的弹窗控件. 摘自:http://philoo.cnblogs.com/ 我的理解,就是panel有的属性Window.dialog都有,同时保留自己的扩展属性方法 , 所以主要展示pannel的属性. Pannel 属性 名称 类型 说明 默认值 title string 显示在Panel头部的标题文字. null iconCls strin

R实战 第三篇:数据处理(基础)

数据结构用于存储数据,不同的数据结构对应不同的操作方法,对应不同的分析目的,应选择合适的数据结构.在处理数据时,为了便于检查数据对象,可以通过函数attributes(x)来查看数据对象的属性,str(x)函数用于查看R对象的内部结构,通过print(x)函数,显示数据对象存储的内容,该函数把数据打印到控制台上,另外,RStudio提供了一个可视化查看数据的函数View(x). 一,处理数据的函数 标量通常是常量,每一个标量都有特定的数据类型,常用的数据类型是数值类型,字符类型,逻辑类型和日期类

算法学习三阶段

?? 第一阶段:练经典经常使用算法,以下的每一个算法给我打上十到二十遍,同一时候自己精简代码, 由于太经常使用,所以要练到写时不用想,10-15分钟内打完,甚至关掉显示器都能够把程序打 出来. 1.最短路(Floyd.Dijstra,BellmanFord) 2.最小生成树(先写个prim,kruscal 要用并查集,不好写) 3.大数(高精度)加减乘除 4.二分查找. (代码可在五行以内) 5.叉乘.判线段相交.然后写个凸包. 6.BFS.DFS,同一时候熟练hash 表(要熟,要灵活,代码要

Jetty学习三:配置概览-需要配置什么

上一节讲述了怎么配置Jetty,这节将告诉你使用Jetty你需要配置些什么. 配置Server Server实例是Jetty服务端的中心协调对象,它为所有其他Jetty服务端组件提供服务和生命周期管理.在标准Jetty发布中,核心的服务端配置是在etc/jetty.xml文件中,你也能在其中包含其他服务端配置,可以包括: 1)ThreadPool Server实例提供了一个线程池,你可以在etc/jetty.xml中配置最大线程数和最小线程数. 2)Handlers Jetty服务端只能有一个H

R语言学习笔记2——绘图

R语言提供了非常强大的图形绘制功能.下面来看一个例子: > dose <- c(20, 30, 40, 45, 60)> drugA <- c(16, 20, 27, 40, 60)> drugB <- c(15, 18, 25, 31, 40) > plot(dose, drugA, type="b") > plot(dose, drugB, type="b") 该例中,我们引入了R语言中第一个绘图函数plot.pl

ZigBee学习三 UART通信

ZigBee学习三 UART通信 本实验只对coordinator.c文件进行改动就可以实现串口的收发. 修改coordinator.c文件 byte GenericApp_TransID; // This is the unique message ID (counter) afAddrType_t GenericApp_DstAddr; unsigned char uartbuf[128];/**************************************************

Spark学习三:Spark Schedule以及idea的安装和导入源码

Spark学习三:Spark Schedule以及idea的安装和导入源码 标签(空格分隔): Spark Spark学习三Spark Schedule以及idea的安装和导入源码 一RDD操作过程中的数据位置 二Spark Schedule 三Idea导入spark源码 一,RDD操作过程中的数据位置 [hadoop001@xingyunfei001 spark-1.3.0-bin-2.5.0]$ bin/spark-shell --master local[2] val rdd = sc.t