大数据应用实例

通过对全国各地不同时间段的购买华硕笔记本电脑的销售量进行大数据处理,将其通过汇总分析,即可制成图表的格式,使用户能对华硕笔记本销售量进

行研究,可以查看出华硕笔记本最近的销售同比(与上一年的销售比较)与环比(与上月的销售比较),购买的人数地域分布量,及购买的人群年龄分布

,性别分布等等

首先就是对华硕笔记本最近的销售同比(与上一年的销售比较)与环比(与上月的销售比较),整体同比及移动同比近一个月下降30%左右,整体环比与

移动环比则上涨5%左右

对于地域分布的情况,则可通过大数据观察到广东,浙江,江苏等省会选择购买华硕笔记本人数居多。

对于人群属性分布的情况,则可通过大数据观察30至50岁人群偏好于华硕笔记本居多,男性与女性对于这牌子的笔记本则以男性选择较多。

如果通过对比近几年的购买量数据的分析,可以观察到每年的3、4月份和7、8月份的购买量增长量较大,并且在14年到16年之间,购买笔记本电脑的消费

者更看好华硕笔记本电脑。

时间: 2024-11-01 14:03:48

大数据应用实例的相关文章

每年为联想省去一个亿 ——Talend大数据解决方案实例

联想公司是一家价值 340 亿美金的个人技术公司和世界上最大的个人电脑供应商.一个企业组织如何构建其愿景.团队和平台以便于更了解其客户的特征是联想面临的最大问题. 2013年, 联想需要将所有数据管理从他们的外包供应商迁移出去.没有预算,没有团队, 没有平台, 联想必须从零开始. 挑战 什么特定产品具有最大的获利能力? 我们应该展示的产品的正确配置是什么? 价格促销及相应竞争是什么? 哪些客户受营销策略的影响并有可能改变他们的采购? 不同组的用户体验的区别是什么? 在他们放弃现有购物车中选定的产

《写给大忙人的hadoop2》读书笔记(一)大数据定义

本文主要内容摘记自电子工业出版社出版的<写给大忙人的Hadoop2>,Douglas Eadline著,卢涛 李颖译.如想深入了解相关内容,请购买正版书籍阅读. 一.大数据的定义 大数据不只是数据量大的意思,根据维基百科(http://en.wikipedia.org/wiki/Big_data),大数据的定义有以下几个特点. 1.数据量(Volume):大的数据量明确界定了大叔与.在某些情况下,数据的庞大规模使其不可能用更为常规的手段来计算. 2.多样性(Variety):数据可能来自不同的

大数据概论

大数据概述 1.大数据时代 1.第三次信息化浪潮 根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革. 信息化浪潮 发生时间 标志 解决问题 代表企业 第一次浪潮 1980年前后 个人计算机 信息处理 Inter.AMD.IBM.苹果.微软.联想.戴尔.惠普等 第二次浪潮 1995年前后 互联网 信息传输 雅虎.谷歌.阿里巴巴.百度.腾讯等 第三次浪潮 2010年前后 物联网.云计算和大数据 信息爆炸 将涌现出一批新的市场标杆企业 2.信息科技为大数据时代提供技术支撑 存

大数据技术之_19_Spark学习_02_Spark Core 应用解析+ RDD 概念 + RDD 编程 + 键值对 RDD + 数据读取与保存主要方式 + RDD 编程进阶 + Spark Core 实例练习

第1章 RDD 概念1.1 RDD 为什么会产生1.2 RDD 概述1.2.1 什么是 RDD1.2.2 RDD 的属性1.3 RDD 弹性1.4 RDD 特点1.4.1 分区1.4.2 只读1.4.3 依赖1.4.4 缓存1.4.5 CheckPoint第2章 RDD 编程2.1 RDD 编程模型2.2 RDD 创建2.2.1 由一个已经存在的 Scala 集合创建,即集合并行化(测试用)2.2.2 由外部存储系统的数据集创建(开发用)2.3 RDD 编程2.3.1 Transformatio

四种典型大数据可视化交互模式及实例

大数据可视化交互设计中,有四种比较典型的交互模式,解决数据的复杂性问题.分别是动态改变视图.多视图关联.视图内容约减.焦点+上下文. 动态改变视图 动态改变视图:导航 动态改变视图:多属性排序 多视图关联 多视图是指将显示区域划分为多个视图或图层,是降低数据复杂性的一种方式.它包括采用同一编码方式编码多个数据子集的小多组图,以及采用不同的编码方式编码同一数据集的多样式图(多视图). 并列放置:便于对比,但需要更大的显示空间 图层叠加:图层数量有较大的限制 概览图和细节图采用相同的编码方式,解决数

大数据量数据存储分表实例(企业级应用系统)附原码

随着数据不断增长,数据库中单表无法满足大数据量的存储,所以我们就提出按照自然时间.单站点信息分表来存储大量秒级数据. 例如:大气.水利.交通(GPS)信息监测系统中的实时数据进行存储,一般时按照开始时间.结束时间.单站点.多站点.监测项目等方式进行数据查询.分析.图表. 如 按5分钟单站点的数据12*24(小时)*365(天)*(监测项)10=100W ,也就是一个站点一年数据量 100w条,100站*100W =1亿条这样的数据是无法满足快速查询. 所以我们就按照 "tb_5M_年_站号&qu

底层战详解使用Java开发Spark程序(DT大数据梦工厂)

Scala开发Spark很多,为什么还要用Java开发原因:1.一般Spark作为数据处理引擎,一般会跟IT其它系统配合,现在业界里面处于霸主地位的是Java,有利于团队的组建,易于移交:2.Scala学习角度讲,比Java难.找Scala的高手比Java难,项目的维护和二次开发比较困难:3.很多人员有Java的基础,确保对Scala不是很熟悉的人可以编写课程中的案例预测:2016年Spark取代Map Reduce,拯救HadoopHadoop+Spark = A winning combat

彻底解密WordCount运行原理(DT大数据梦工厂)

主要内容: 数据流动视角解密WordCount RDD依赖关系视角解密WordCount DAG与Lineage的思考 ==========数据流动视角============ 新建文件,里面输入 Hello Spark Hello Scala Hello Hadoop Hello Flink Spark is awesome 修改代码: package com.dt.spark.SparkApps.cores; import java.util.Arrays; import java.util

大数据时代的图表可视化利器——highcharts,D3和百度的echarts

还记得阿里巴巴那个令人澎湃激情的双十一吗?还记得淘宝生动形象地把你的的消费历程一一地展示给你看吗?还记得那些酷炫拽的it报告图表吗?在这个大数据越来越盛行的年代,怎样去表达一些用户的关系,人物的关联,甚至是事情的发展,都让我们有更多的表达方式.其中最简单直接,形象明了的就是用图表说明问题了. 如果在以前,要实现各种图表,可能很多人会选择flash.但是flash成本较高,图表多的时候很耗性能.后来越来越多的纯js框架出现,让大家有了更多的选择.所以接下来我想推荐几个不错的图表js框架给大家用.