Flume参数小结

名词解释:

1、netcat:通过网络端口获取数据,source的实现类

2、logger:将数据显示到控制台,sink的实现类

3、memory: ,channel的实现类

4、capacity:是指channel的最大容量

5、spooldir:本地文件目录(文件夹)用来读取数据(文件)

6、file Header:存取采集数据所在文件的绝对路径,默认为true

7、event:将数据反序列化生成的对象,有两个属性,分别是header 和 body

8、fileSuffix:更改文件后缀名

9、flume在采集数据的时候,会将数据封装成一个event对象,event对象的里面有:header:Map[String,String]属性,还有一个body(数据的本身):byte[ ]属性;

10,kafkaSink:将数据存储到Kafka集群中

11、filePrefix:文件的前缀名

12、exec :执行,exec source 是指命令行的source,可以执行Unix命令

# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1

# Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444

# Describe the sink
a1.sinks.k1.type = logger

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

  

原文地址:https://www.cnblogs.com/beiyi888/p/9859131.html

时间: 2024-10-14 22:52:50

Flume参数小结的相关文章

Flume 参数调优

Flume 参数调优 Source 增加 Source 数量(使用 Tair Dir Source 时可增加 FileGroups 个数),可以增大 Source 的读取数据的能力.例如:当某一个目录产生的文件过多时需要将这个文件目录拆分成多个文件目录,同时配置好多个 Source 以保证 Source 有足够的能力获取到新产生的数据.batchSize 参数决定 Source 一次批量运输到 Channel 的 event 条数,适当调大这个参数可以提高 Source 搬运 Event 到 C

Flume使用小结

本文介绍初次使用Flume传输数据到MongoDB的过程,内容涉及环境部署和注意事项. 1 环境搭建 需要jdk.flume-ng.mongodb java driver.flume-ng-mongodb-sink(1)jdk下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html(2)flune-ng下载地址:http://www.apache.org/dyn/closer.

Python: 函数参数小结

参数的类型: 函数的参数有2种类型: 1. 函数定义时用于接收值的形式参数Parameters. 2. 函数调用时用于传递值的实际参数Arguments. 参数的传递: 传递方式有2种: 1. 值传递: 将实参的值复制一份给形参, 不管此值是原始值, 指针值还是堆对象值. 2. 引用传递: 将形参与实参引用相同的对象. 传递形式有2种: 1. 按位置传递: 2. 按命名传递: 形参的定义: 函数的形参可分为: 1. 普通参数 2. 默认参数: 具有默认值的参数 3. 变长参数: 根据传递参数传递

if参数小结

条件表达式 if [ -f  file ]    如果文件存在 if [ -d ...   ]    如果目录存在 if [ -s file  ]    如果文件存在且非空 if [ -r file  ]    如果文件存在且可读 if [ -w file  ]    如果文件存在且可写 if [ -x file  ]    如果文件存在且可执行   if [ int1 -eq int2 ]    如果int1等于int2   if [ int1 -ne int2 ]    如果不等于    i

jsHint 配置参数小结

jsHint 规则 参考资料http://www.cnblogs.com/code/articles/4103070.html:http://www.htmlhifive.com/conts/web/view/library/JSLint_JSHint 选项  内容  值 错误信息 bitwise  禁用位运算符(如^,&)   设置:true; 不设置:false  Unexpected use of '???'.(设置true时) curly  if和while等语句中使用{}来明确代码块

FLUME日志收集

一.FLUME介绍 Flume是一个分布式.可靠.和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据:同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力. 设计目标: (1) 可靠性 当节点出现故障时,日志能够被传送到其他节点上而不会丢失.Flume提供了三种级别的可靠性保障,从强到弱依次分别为:end-to-end(收到数据agent首先将event写到磁盘上,当数据传送成功后,再删除:如果数据发送失败,可以重新发送.),Store on fa

python基础教程函数参数

python里有很多的内置函数给我们的工作带来了很多发便利,在我们实现某些功能或者优化代码的时候,可以自己定义一个函数,同时我们在定义一个类的时候也会用到函数的一些知识去构造一个方法,这里就涉及到一些关于函数的基础知识和函数传参的知识. 一.函数的相关介绍 1.函数定义:函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可. 函数特性: 减少重复代码 使程序变的可扩展 使程序变得易维护 2.函数的定义示例 定义一个函数要使用def语句,依次写出函数名.括

大数据系统之监控系统(二)Flume的扩展

一些需求是原生Flume无法满足的,因此,基于开源的Flume我们增加了许多功能. EventDeserializer的缺陷 Flume的每一个source对应的deserializer必须实现接口EventDeserializer,该接口定义了readEvent/readEvents方法从各种日志源读取Event. flume主要支持两种反序列化器: (1)AvroEventDeserializer:解析Avro容器文件的反序列化器.对Avro文件的每条记录生成一个flume Event,并将

For和Set参数学习笔记

Batch tips, for /f参数用法:1.1 "delims=*"等号左右空格是有意义的. 1.2 option的默认参数是"delims= ",故默认参数情况一下,读一行参数遇到空格就不读了.需要把整行读完的话,我们可以使delims的参数为最后结尾的字符. set参数小结:2.1 set i="abc" 给i赋值字符串.如:set i="abc"echo %i%if %i%=="abc" (ec