Flume 与Kafka区别

　　　今天开会讨论日志处理为什么要同时使用Flume和Kafka，是否可以只用Kafka 不使用Flume？当时想到的就只用Flume的接口多，不管是输入接口(socket 和文件)以及输出接口(Kafka/HDFS/HBase等)。

　　　考虑单一应用场景，从简化系统的角度考虑，在满足应用需求的情况下可能只使用一个比较好。但是考虑到现有系统业务发展，为了后面的灵活扩展，在先用系统设计时留有一定的扩展性感觉更重要，可能使用Flume+kafka架构相对只使用Kafka会多占用1-2台机器做Flume日志采集，但是为了方便以后日志数据处理方式的扩展，可以采用Flume+kafka架构。

　　Flume ：管道 ----个人认为比较适合有多个生产者场景，或者有写入Hbase、HDFS和kafka需求的场景。

　　Kafka ：消息队列-----由于Kafka是Pull模式，因此适合有多个消费者的场景。

　　目前应用场景，一台日志转发机负责产生日志。后端需要通过Strom消费日志信息，建议可以设置成log-->Kafka->Strom.如果以后有写入Hbase或者HDFS的需求可以，在Kafka后面再接上Strom，或者在日志转发机上直接日志落地，由Flume去读取日志消息。

参考：

Kafka与Flume区别

Kafka与Flume对比

基于Flume的美团日志收集系统

Using Flume要点

时间： 2024-08-07 04:57:14

Flume 与Kafka区别的相关文章

消息系统Flume与Kafka的区别

首先Flume和Kafka都是消息系统,但是它俩也有着很多不同的地方,Flume更趋向于消息采集系统,而Kafka更趋向于消息缓存系统. [一]设计上的不同 Flume是消息采集系统,它主要解决问题是消息的多元采集.因此Flume在实现上提供了多达十几种的Flume Source,以供用户根据不同的应用场景来采集数据.也正因为Flume提供了这些采集消息的Flume Source,使得用户采集消息变得很简单,用户往往只需要对原始数据稍作处理然后将数据发送给Flume Source.在Flume

Flume和Kafka

本文是学习时的自我总结,用于日后温习.如有错误还望谅解,不吝赐教此处附上部分内容所出博客:http://blog.csdn.net/ymh198816/article/details/51998085 Flume+Kafka+Storm+Redis实时分析系统基本架构 1) 整个实时分析系统的架构是 2) 先由电商系统的订单服务器产生订单日志, 3) 然后使用Flume去监听订单日志, 4) 并实时把每一条日志信息抓取下来并存进Kafka消息系统中, 5) 接着由

flume 整合kafka

背景:系统的数据量越来越大,日志不能再简单的文件的保存,如此日志将会越来越大,也不方便查找与分析,综合考虑下使用了flume来收集日志,收集日志后向kafka传递消息,下面给出具体的配置 # The configuration file needs to define the sources, # the channels and the sinks. # Sources, channels and sinks are defined per agent, # in this case call

flume写kafka topic覆盖问题fix

结构: nginx-flume->kafka->flume->kafka(因为牵扯到跨机房问题,在两个kafka之间加了个flume,蛋疼..) 现象: 在第二层,写入kafka的topic和读取的kafka的topic相同,手动设定的sink topic不生效打开debug日志: source实例化: 21 Apr 2015 19:24:03,146 INFO [conf-file-poller-0] (org.apache.flume.source.DefaultSourceFac

flume从kafka读取数据到hdfs中的配置

#source的名字 agent.sources = kafkaSource # channels的名字,建议按照type来命名 agent.channels = memoryChannel # sink的名字,建议按照目标来命名 agent.sinks = hdfsSink # 指定source使用的channel名字 agent.sources.kafkaSource.channels = memoryChannel # 指定sink需要使用的channel的名字,注意这里是channel

flume从kafka中读取数据

a1.sources = r1 a1.sinks = k1 a1.channels = c1 #使用内置kafka source a1.sources.r1.type = org.apache.flume.source.kafka.KafkaSource #kafka连接的zookeeper a1.sources.r1.zookeeperConnect = localhost:2181 a1.sources.r1.topic = kkt-test-topic a1.sources.r1.batc

Kafka实战－Flume到Kafka （转）

原文链接:Kafka实战-Flume到Kafka 1.概述前面给大家介绍了整个Kafka项目的开发流程,今天给大家分享Kafka如何获取数据源,即Kafka生产数据.下面是今天要分享的目录: 数据来源 Flume到Kafka 数据源加载预览下面开始今天的分享内容. 2.数据来源 Kafka生产的数据,是由Flume的Sink提供的,这里我们需要用到Flume集群,通过Flume集群将Agent的日志收集分发到 Kafka(供实时计算处理)和HDFS(离线计算处理).关于Flume集群的Ag

flume 读取kafka 数据

本文介绍flume读取kafka数据的方法代码: /******************************************************************************* * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agreements. See the NOTICE file * distributed with

Flume 学习笔记之 Flume NG+Kafka整合

Flume NG集群+Kafka集群整合: 修改Flume配置文件(flume-kafka-server.conf),让Sink连上Kafka hadoop1: #set Agent name a1.sources = r1 a1.channels = c1 a1.sinks = k1 #set channel a1.channels.c1.type = memory a1.channels.c1.capacity = 1000 a1.channels.c1.transactionCapacit

猜你喜欢

构建之法阅读笔记01

发布日期:2017.6.16 1.1节通过3个简短的对话和一个生活实例,启发我对什么是程序,什么是软件,什么是软件工程,没有使用到算法需不需要学习.掌握,软件和算法,数据结构有无关联等问题的思考.仔细 ...

进行独立于后台后端的前端开发——学习Mockjs

Mockjs实现的功能 1.让前端攻城师独立于后端进行开发. 2.通过随机数据,模拟各种场景.增加单元测试的真实性 3.不需要修改既有代码,就可以拦截 Ajax 请求,返回模拟的响应数据. 4.用法简 ...

【深入Java虚拟机】之八：Java垃圾收集机制

转载请注明出处:http://blog.csdn.net/ns_code/article/details/18076173 对象引用 Java中的垃圾回收一般是在Java堆中进行,因为堆中几乎存放了J ...

20个非常有用的Java程序片段

1. 字符串有整型的相互转换 1 2 String a = String.valueOf(2); //integer to numeric string int i = Integer.par ...

安装Tomcat8，在Eclipse中配置Tomcat8

最近想学一下Java Web,在这里记录下学习过程,也方便以后如果忘了,可以方便查阅. 这篇是关于Tomcat的安装,最新的Tomcat是Tomcat 8.可以从Tomcat官网下载,我使用的是win ...

复选框省市区联动（监听input的change事件）

需求:省市区三级包含复选框按钮以及文字描述.点击文字显示对应的下级地区,点击复选框选择对应的下级区域勾选. 分析:监听input的change事件当点击复选框省选择对应的第一个市区,同时默认选中第 ...

HDU 5884 Sort -2016 ICPC 青岛赛区网络赛

题目链接 #include <iostream> #include <math.h> #include <stdio.h> #include<algorith ...

Python编码_ASCII_Unicode_UTF-8

获取一个字符的ASCII码值,使用内置函数 ord(),ASCII码占一个字节 ascii不能存中文 >>> # A 和 a 分别的对应的ASCII码值是 >>> ...

Oracle 添加主键

http://blog.csdn.net/zhanggnol/article/details/6221895 http://blog.csdn.net/shishaomeng/article/deta ...

LNMP设置404错误页面

LNMP即Linux+Nginx+MySQL+PHP的web架构. 1.在网站的根目录touch 文件404.html,内容如下: <html> <body><H ...

从二叉树改链表引发的递归二三想

递归其实就是寻找通项公式,但是通项公式可以有轻微的区别. 比如二叉树改链表(只调整箭头方向)这件事情,用以下两种方法都可以实现. 方法1: 从根开始 (1)调整左子树 (2)调整右子树 (3)(如何 ...

android ipc通信机制之之三，进程通讯方式。

IPC通讯方式的优缺点: IPC通讯方式的对比名称优点缺点适用场景 Bundle 简单易用只能传输Bundle支持的数据类型四大组件的进程通信文件共享简单易用不适合高并发场景,并无法 ...

一个可以作为代理服务器或者转发的java类

项目中用到,这里把它给简化和通用了,突出基本思路,具体可以基于这个类来修改. 基于java容器和servlet. package com.xxx.first; import java.io.Buffe ...

算对于传统软件工程的影响

说起云计算对于传统软件工程的影响,我们当然首先需要了解这两个概念. 一.传统软件工程首先是传统软件工程,了解传统软件工程其实就是了解软件工程的历史,早期的计算机系统以硬件为主,程序员在早期的计算机上 ...

iOS多线程之NSOperation的使用

NSOperation对象的使用步骤 NSOperation对象描述了一个操作任务:NSOperationQueue对象描述了一个任务队列,相当于GCD的dispatch_queue_t NSOper ...

docker下的mysql无法启动

问题: mysql启动报如下错误---------ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/va ...

大数据分包算法

一个数据包最大长度是8K超过8188字节的数据需要分成多个数据包来传输第一个数据包的前4字节用于存放将要传输数据的长度,后面8188字节才是数据(4+8188=8192字节)第二个数据包8192字节全 ...

jquery之checkbox

//checkbox 数据回显 var publishRange=rowData.publishRange.split(","); for(var i = 0;i ...

iOS开发小功能自学之二：分页（进行封装处理）

主要用Xib方式,代码后期还会有进一步的优化下次用代码的时候一定要复制一份再用,直接拿出源代码来不小心哪里碰了下,耽误了10多分钟去找bug,郁闷!!! 功能:类似于手机打开新浪网首页最上面的大图片 ...

寻找节点d＝n的节点算法

这里的算法是毕设过程中,自己想到的,也不知道有不有人提出过.这里就记录下发现的过程的具体的算法,以后会用到背景描述毕设做的是「社交网络中病毒传播的预测」,前期过程主要是模拟几个网络的数据,然后从一 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.