2016-12-20

初识Storm

1.storm有一个分支,则这个分支一个事jstorm,这个是阿里巴巴将要开源的
2.离线计算:
批量获取数据,批量传输数据
代表技术:Sqoop批量导入数据,HDFS批量存储数据,MapReduce批量计算数据
大量消耗hive,消耗大量SQL语句
主要工作量:
1.hivesql(工作量较多)
2.调度平台
3.hadoop 集群运维
4.数据清洗(脚本语言)
5.元数据管理
6.数据稽查
7.数据仓库模型架构

3.流式计算:
数据实时产生产生,数据实时传输,数据实时计算,实时展示
代表技术:Flume实时获取数据,Kafka/metag实时数据存储,Storm/JStorm实时数据计算,Redis实时结果缓存,持久化存储
一句话总结:将源源不断的产生的数据实时手机并实时计算,尽可能快的得到计算结果

4.离线计算与实时计算的区别
最大的区别:实时收集,实时计算,实时展示

Storm用来实时处理数据,特点:低延迟,高可用,分布式,可扩展,数据不丢失,提供简单容易理解的接口,便于开发。

我们为什么要进行实时监控:
1.例如11.11,我们可以监控自己的流量情况,根据实时的情况可以发一些优惠券,从而可以最大限度的刺激消费
2.对于业务人员,可以看自己的所管辖的业务范围内,根据用户所喜爱的东西来适当的发布优惠券,例如对于用户所喜爱的,我们可以少发布优惠券,对于用户不喜爱的产品,我们可以大量发布优惠券,从而可以起到刺激消费的功能,
以上两点就是为什么要进行实时监控的原因

海量数据:
数据类型很多,产生数据的终端很多,处理数据能力增强
Storm用来实时处理数据,特点:低延迟,高可用,分布式,可扩展,数据不丢失,提供简单容易理解的接口,便于开发。

时间: 2024-10-08 19:35:02

2016-12-20的相关文章

mysql练习题-2016.12.16

>>>>>>>>>> 练习时间:2016.12.16 编辑时间:2016-12-20-->22:12:08 题: 涉及:多表查询.exists.count().group by.order by 1.1 关系模式 学生student:   SNO:学号:   SNAME:姓名:   AGE:年龄 :   SEX:性别 课程course:CNO:课程代码,CNAME:课程名称,TEACHER:教师 学生成绩SC:SNO:学号,CNO:课程代码

【读书笔记】2016.12.10 《构建高性能Web站点》

本文地址 分享提纲: 1. 概述 2. 知识点 3. 待整理点 4. 参考文档 1. 概述 1.1)[该书信息] <构建高性能Web站点>: -- 百度百科 -- 本书目录: 第1章 绪论 1.1 等待的真相 1.2 瓶颈在哪里 1.3 增加带宽 1.4 减少网页中的HTTP请求 1.5 加快服务器脚本计算速度 1.6 使用动态内容缓存 1.7 使用数据缓存 1.8 将动态内容静态化 1.9 更换Web服务器软件 1.10 页面组件分离 1.11 合理部署服务器 1.12 使用负载均衡 1.1

关于2016.12.12——T1的反思:凸包的意义与应用

2016.12.12 T1 给n个圆,保证圆圆相离,求将圆围起来的最小周长.n<=100 就像上图.考场上,我就想用切线的角度来做凸包.以圆心x,y排序,像点凸包一样,不过用两圆之间的下切线角度来判断. 这就是下切线(我自己瞎编的名字): 好像是对的啊: 然后我就保证必AC的希望,用这种写法交了,然后就只得了N=2的暴力分... 自以为是正解,却落得如此下场... 为什么?这样不对吗?借用学长的力量,果然被Hack掉了: 这种情况,圆心排序后,检测的顺序并不是圆上的切点的顺序,自然就会挂. 蓝瘦

12.17 Nginx负载均衡;12.18 ssl原理;12.19 生产ssl密钥对;12.20 Nginx配置ssl

扩展: 针对请求的uri来代理 http://ask.apelearn.com/question/1049 根据访问的目录来区分后端web http://ask.apelearn.com/question/920 12.17 Nginx负载均衡 1. 安装dig命令: [[email protected] ~]# yum install -y bind-utils 2. 用dig获取qq.com的ip地址: [[email protected] ~]# dig qq.com 3. 创建ld.co

rhel 7.0 配置centos yum源(2016/12/8),成功!

1.首先查看redhat 7.0系统本身所安装的那些yum 软件包: rpm -qa | grep yum #列出所有已安装的yum包 2.删除这些包: rpm -e *.rpm --nodeps #删除所有以前的yum包 3.下载新的yum rpm包:(2016/12/8 最新版本rpm,如果404 NOT FOUND错误,自己进去网址,换成最新的rpm包的名字) wget http://mirrors.163.com/centos/7/os/x86_64/Packages/yum-3.4.3

第一小组作业 2016.12.8

Sprint计划会议 会议时间:2016/12/8  14:00 会议地点:操场 会议进程: l 首先我们讨论排球计分程序功能最后的制定. l 然后我们讨论实现基本功能的各项工作. l 之后我们讨论各项工作的分工和认领. l 最后每个人对自己的任务进行必要的估算. 团队的Backlog 初期目标:完成程序前期的一切准备,并编写出核心代码的基本雏形. 任务 认领人 估计完成时间 代码编写 胡腾启 20h(>=2h/天) 代码复审 李永威 15h(>=2h/天) 发表博客,组织会议 宋彤彤 15h

Oracle中把一个DateTime的字符串转化成date类型。to_date(&#39;2016/12/8 18:55:43&#39;,&#39;yyyy/MM/dd hh24:mi:ss&#39;),

Oracle中把一个DateTime或者该形态字符串转化成date类型. to_date('2016/12/8 18:55:43','yyyy/MM/dd hh24:mi:ss'), 或者: select to_date('2010-10-20 13:23:44','yyyy-mm-dd hh24:mi:ss')  from dual; 是用" /"还是" -"取决于字符串是什么结构的. date类型转换成char类型, 例子to_char(' ','yyyymmd

2016/02/20 codes

<!DOCTYPE html><html><head lang="en"> <meta charset="UTF-8"> <title>2016/02/20</title></head><body><div id="mainDiv"> <div id = "content"> <div id = &qu

2015.12.14-2015.12.20 大论文计划

利用一周时间完成大论文,大论文优先级大于前端学习 12.14周一,写第一章绪论部分; 12.15周二,写完第三章 12.16周三,写完第五章 12.17周四,写完中英文摘要,各章节总结重新增加内容 12.18周五,重修1,2章 12.19周六,重修3,4章 12.20周七,重修5章,写完第6章 附:前端研修的内容

2016/7/20 1:18:29 PyQT5 炫酷的左侧导航效果

2016/7/20 1:18:29  完整code from PyQt5.QtWidgets import (QApplication, QWidget, QHBoxLayout, QTreeWidget, QTreeWidgetItem, QGroupBox) from PyQt5.QtGui import QIcon, QPixmap from PyQt5.QtCore import QSize class Bar_Navigation(QWidget): def __init__(self