R语言实战-如何分析QQ群记录2-每日信息数量图

构思步骤:

  1、从data中取出时间数据。

  2、从时间数据中提取日期数据。

  3、根据日期数据进行汇总每日的消息数量。

  4、利用ggplot2进行绘图。

#从data中获取时间信息
time<-data$dateTime

#把时间中的日期属性提取出来
p<-paste(year(time),month(time),day(time),sep="-")

#把p转换为数据框
Timed<-data.frame(p)

#通过P分组,p段名称变成days,增加数量列Freq,根据数量进行分组
fenzu<-sqldf("select p days,count(*)Freq from Timed group by p")

#上面fenzu后日期排序是混乱的,需要针对日期进行排序,从小到大
#as.date()把days列转变为日期
#order()把日期进行从小到大排序
fenzu<- fenzu[order(as.Date(fenzu$days)),]

#利用ggplot开始作图
#数据为fenzu,x轴为days,y轴为Freq
ggplot(fenzu,aes(x=as.Date(days),y=Freq))+
  #绘制密度图,向下填充颜色为中紫色,透明度为0.5
    geom_area(fill="mediumpurple1",alpha=0.5)+
  #绘制顶点,顶点为?标记,大小为3,颜色为蓝色
    geom_point(shape="?",size=3,colour="blue")+
  #x坐标轴名称为时间,y坐标轴名称为消息密集度
    xlab("时间")+ylab("消息密集度")+
  #设置图表的主题
  theme_solarized_2()

  最终生成下图:

时间: 2024-10-09 20:34:12

R语言实战-如何分析QQ群记录2-每日信息数量图的相关文章

R语言︱异常值检验、离群点分析、异常值处理

在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值.异常值.不一致的值.重复数据及含有特殊符号(如#.¥.*)的数据 数据清洗:删除原始数据集中的无关数据.重复数据.平滑噪声数据.处理缺失值.异常值等 缺失值处理:删除记录.数据插补和不处理 主要用到VIM和mice包 install.packages(c("VIM","mice")) 1.处理缺失值的步骤 步骤: (1)识别缺失数据:

R语言实战(五)方差分析与功效分析

本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ==================================================================== 方差分析: 回归分析是通过量化的预测变量来预测量化的响应变量,而解释变量里含有名义型或有序型因子变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析方法就是方差分析(ANOVA).因变量不只一个时,称为多元方差分析(MANOVA).有协变量时,称为协方差分析(ANCOVA)或多元协方差分析

R语言实战(四)回归

本文对应<R语言实战>第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.通常,回归分析可以用来挑选与相应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量. 回归分析的各种变体 回归类型 用途 简单线性 用一个量化的解释变量预测一个量化的响应变量 多项式 用一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式 多元线性 用两个或多个量化的解释变量预测一个

R语言实战(八)广义线性模型

本文对应<R语言实战>第13章:广义线性模型 广义线性模型扩展了线性模型的框架,包含了非正态因变量的分析. 两种流行模型:Logistic回归(因变量为类别型)和泊松回归(因变量为计数型) glm()函数的参数 分布族 默认的连接函数 binomial (link = "logit") gaussian (link = "identity") gamma (link = "inverse") inverse.gaussian (lin

《R语言实战》(中文完整版)pdf

下载地址:网盘下载 基本介绍 编辑 原作名: R in Action[2] 作者: Robert I. Kabacoff 译者: 高涛 / 肖楠 / 陈钢 出版社: 人民邮电出版社 出版年: 2013-1 页数: 388 定价: 79.00元 装帧: 平装 ISBN: 978-711-529-990-1 内容简介 编辑 数据时代已经到来,但数据分析.数据挖掘人才却十分短缺.由于"大数据"对每个领域的决定性影响,相对于经验和直觉,在商业.经济及其他领域中基于数据和分析去发现问题并作出科学

《数据挖掘:R语言实战》

<数据挖掘:R语言实战> 基本信息 作者: 黄文    王正林 丛书名: 大数据时代的R语言 出版社:电子工业出版社 ISBN:9787121231223 上架时间:2014-6-6 出版日期:2014 年6月 开本:16开 页码:292 版次:1-1 所属分类:计算机 > 软件与程序设计 > 综合 > 高级程序语言设计 更多关于>>><数据挖掘:R语言实战> 内容简介 书籍 计算机书籍 数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景

《R语言实战》学习笔记seventh

由于在准备软考中级数据库系统工程师外加巩固SQL Server 2012,所以拖了好久一直没继续学R 下去 所以今天重开R 的战事 这次是关于基本统计分析的内容,即关于用于生成基本的描述性统计量和推断统计量的R 函数 首先,将着眼于定量变量的位置和尺度的衡量方式 然后将是生成类别型变量的频数表和列联表的方法(以及连带的卡方检验) 接下来将考察连续型和有序型变量相关系数的多种形式 最后转而通过参数检验(t检验)和非参数检验(Mann-Whitney U检验.Kruskal-Wallis检验)方法研

《R语言实战》学习笔记fourth

又拖了好久继续写R 语言的学习笔记了啊 这次到了基本数据管理了,众所周知数据准备是数据分析的最重要的前提 书本是从一个例子开始本章的内容的,例子是一个类似调查问卷的 然后把回答标为从1到5,再进行分析(这让我想到了自学SPSS 的时候啊) > manager <- c(1, 2, 3, 4, 5) > date <- c("10/24/08", "10/28/08", "10/1/08", "10/12/08&q

《数据挖掘R语言实战》图书介绍,数据挖掘相关人员看过来!

今天介绍一本书<数据挖掘R语言实战>.数据挖掘技术是当下大数据时代最关键的技术,其应用领域及前景不可估量.R是一款极其优秀的统计分析和数据挖掘软件,R语言的特点是入门容易,使用简单. 这本书侧重使用R进行数据挖掘,重点进述了R的数据挖掘流程.算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R软件进行深入潜出和全面的介绍,以便读者能深刻理解R的精髓并能快速.高效和灵活地掌握使用R进行数据挖掘的技巧. 本书以数据预处理.基本算法及应用和高级算法及应用这三篇展示. (1)上篇:数据预处