R语言在不同样本量下的Little's MCAR检验

原文链接:http://tecdat.cn/?p=10134



我进行一个小型仿真,以在不同样本量下测试Little的MCAR检验1。我可以研究线性回归中的异方差。我能够找到一些使用Little‘s MCAR检验的小样本研究人员的例子,因此我进行了仿真。

library(BaylorEdPsych)
library(simglm)
library(ggplot2)
library(dplyr)
library(mice)
fixed <- ~1 + age + income
fixed_param <- c(2, 0.3, 1.3)
cov_param <- list(dist_fun = c(‘rnorm‘, ‘rnorm‘),
                  var_type = c("single", "single"),
                  opts = list(list(mean = 0, sd = 4),
                              list(mean = 0, sd = 3)))

ggplot(little.mcar.p, aes(x = n, y = p)) + geom_boxplot() +
  geom_crossbar(aes(ymin = q025, y = q05, ymax = q075), data = summarise(
    group_by(little.mcar.p, n), q025 = quantile(p, .025, na.rm = TRUE),
    q05 = quantile(p, .05, na.rm = TRUE), q075 = quantile(p, .075, na.rm = TRUE)
  )) +
  geom_hline(yintercept = .05) +
  scale_y_continuous(breaks = seq(0, 1, .05), limits = c(0, 1)) +
  labs(x = "Sample size", y = "p-value",
       title = "Little‘s MCAR test for data that are MCAR",
       subtitle = "2000 replications",
       caption = paste(paste("For the narrow boxes, going from top to bottom, lines",
                             "represent 7.5th, 5th and 2.5th percentiles of p-values."),
                       "Test maintains nominal error rate across wide range of sample sizes.",
                       sep = "\n"))

?

ggplot(little.mcar.p.mar, aes(x = n, y = p)) + geom_boxplot() +
  geom_crossbar(aes(ymin = q925, y = q95, ymax = q975), data = summarise(
    group_by(little.mcar.p.mar, n), q925 = quantile(p, .925, na.rm = TRUE),
    q95 = quantile(p, .95, na.rm = TRUE), q975 = quantile(p, .975, na.rm = TRUE)
  ), linetype = 2) +
  geom_hline(yintercept = .05) +
  scale_y_continuous(breaks = seq(0, 1, .05), limits = c(0, 1)) +
  labs(x = "Sample size", y = "p-value",
       title = "Little‘s MCAR test for data that are MAR",
       subtitle = "2000 replications",
       caption = paste(paste("For the dashed boxes, going from top to bottom, lines",
                             "represent 97.5th, 95th and 92.5th percentiles of p-values."),
                       "Test only maintains nominal error rate around sample size of 120.",
                       sep = "\n"))

?

回归接近完美(没有多重共线性)。

如果您有任何疑问,请在下面发表评论。

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

?QQ:3025393450

?QQ交流群:186388004 

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据爬虫采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询

欢迎关注微信公众号,了解更多数据干货资讯!

欢迎选修我们的R语言数据分析挖掘必知必会课程!

R语言在不同样本量下的Little's MCAR检验

原文地址:https://www.cnblogs.com/tecdat/p/12205097.html

时间: 2024-10-09 12:21:40

R语言在不同样本量下的Little's MCAR检验的相关文章

R语言在Linux环境下安装Curl出错问题的解决

运行 install.packages("RCurl") 得到这样的结果 > I have some problem in running R-cran's Demography package. > The hmd.mx function need Rcurl. I tried to install RCurl, but meet the following error: > *********************************************

R 语言解压目录下的所有gz文件

setwd("GSE29431_RAW") # 进入目录 fileNames <- list.files() # 获取目录下的所有文件 sapply(fileNames, gunzip) # 进行解压操作,fileNames是一个向量,gunzip是解压缩的函数,sapply()会依次将fileNames中的元素应用gunzip函数 原文地址:https://www.cnblogs.com/0820LL/p/11651288.html

R语言 重命名目录下所有文件

myfilepath <- "F:/paper2/climateExposure/wjj_mec/second/paths/" setwd(myfilepath) alltypefiles = dir(myfilepath) newname = gsub(pattern = 'paths.',replacement = 'paths_',x = alltypefiles) file.rename(alltypefiles,newname) 原文地址:https://www.cnb

皮尔森相似度计算举例(R语言)

整理了一下最近对协同过滤推荐算法中的皮尔森相似度计算,顺带学习了下R语言的简单使用,也复习了概率统计知识. 一.概率论和统计学概念复习 1)期望值(Expected Value) 因为这里每个数都是等概率的,所以就当做是数组或向量中所有元素的平均数吧.可以使用R语言中函数mean(). 2)方差(Variance) 方差分为population variance总体方差和sample variance样本方差,区别是总体方差除以N,样本方差除以N-1. 数理统计中常用样本方差,R语言的var()

R语言入门:数据框的创建和访问

想要创建一个数据框,首先应当创建数据框当中的数据,然后再将这些数据纳入到数据框这个数据结构当中在数据较少的情况下也可以直接通过一行代码进行创建,如下所示: > data<-data.frame(name=c("John","Bob","Mike"),weight=c(123,34,565),height=c(178,160,180)) 这样我们打印出这个数据框当中的数据为: > data name weight height 1

【数据分析 R语言实战】学习笔记 第三章 数据预处理 (下)

3.3缺失值处理 R中缺失值以NA表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na()它可以应用于向量.数据框等多种对象,返回逻辑值. > attach(data) The following objects are masked fromdata (pos = 3): city, price, salary > data$salary=replace(salary,salary>5,NA) > is.na(salary) [1] FALSEFALSE TRUE

CentOS环境下R语言的安装和配置

最近在看数据统计和分析,想到了R语言,于是就着手在自己的CentOS环境下进行安装和配置.步骤如下: 1.前往R官网下载安装包. 2.解压压缩包:tar xvzf R-3.2.2.tar.gz 3.进行编译:./configure --prefix=/usr/local/rscript(--prefix的内容自定,这是R的安装目录) 注意:此过程中可能会出现以下错误: --with-readline=yes (default) and headers/libs are not available

R(1)Mac OS 下安装R语言开发环境

本文原文连接: http://blog.csdn.net/freewebsys/article/details/45825267 转载请注明出处! 1,关于R 参考百度: http://baike.baidu.com/view/942569.htm R是一个免费的自由软件,它有UNIX.LINUX.MacOS和WINDOWS版本,都是可以免费下载和使用的.在那儿可以下载到R的安装程序.各种外挂程序和文档.在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得. R的原代码可自由下

在Linux下安装R语言软件

安装环境: centos.R3.0.1 1.在终端下下载: #cd /usr/local/ #wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz  (终端下输入) 2.解压文件: #tar -zxvf R-3.0.1.tar.gz #cd R-3.0.1 3.安装文件 #yum install gcc-gfortran #yum install glibc-headers #yum install gcc-c++ #yu