[Flume] - flume安装

Apache Flume是一个分布式的、可靠的、高效的系统,可以将不同来源的数据收集、聚合并移动到集中的数据存储中心上。Apache Flume不仅仅只是用到日志收集中。由于数据来源是可以定制的,flume可以使用传输大量的自定义event数据,包括但不限于网站流量信息、社会媒体信息、email信息以及其它可能的数据。Flume是Apache软件基金组织的顶级项目。官网http://flume.apache.org/.



一、安装

  flume提供了二进制安装版本,所有我们可以选择直接下载二进制安装版本,不用自己编译。下载地址http://flume.apache.org/download.html,也可以选择apache的归档库进行其他版本的下载,地址为http://archive.apache.org/dist/flume/。由于我们使用的是centos系统,直接使用命令下载软件并安装,安装完成后,可以选择将flume的bin目录添加到path环境变量中。

wget http://archive.apache.org/dist/flume/1.6.0/apache-flume-1.6.0-bin.tar.gz
解压
tar -zxvf apache-flume-1.6.0-bin.tar.gz
建立软连接
cd ..
ln -s softs/apache-flume-1.6.0-bin flume

二、一个简单的Flume例子

  在Flume1.X以后版本,进行了很大的结构更改,Flume主要组件为agent,分别由source、channel和sink组成。source的作用主要是收集外部数据,并将数据发送给channel。channel的主要作用是存储数据,作为一个数据流的通道。sink的作用主要是从channel中读取数据,并将数据发送给下一个agnet或者目的地。结构如图所示:

  这里采用一个最简单的例子,全部使用flume自带组件,分别使用avro source, memory channel,logger sink。实现功能为:avro监听端口44444,然后将数据发送给channel,sink读取数据后,将数据打印到控制台。

## example: a single-node flume configuration

# name the compoents on this agent
a1.sources=r1
a1.sinks=s1
a1.channels=c1

# describe/configure the source
a1.sources.r1.type=netcat
a1.sources.r1.bind=0.0.0.0
a1.sources.r1.port=44444

# describe/configure the sink
a1.sinks.s1.type=logger

# describe/configure the channel
a1.channels.c1.type=memory
a1.channels.c1.capacity=1000
a1.channels.c1.transactionCapacity=100

# bind all compoents of source and sink to channel
a1.sources.r1.channels=c1
a1.sinks.s1.channel=c1

  启动flume命令为:

bin/flume-ng agent -n a1 -f conf/flume-conf.properties

看见下图表示启动成功,或者你通过jps命令查看是否有Application进程,如果有表示成功。

  通过telnet来连接发送数据。命令为 telnet ip port。最终结果如图:

时间: 2024-08-27 04:22:53

[Flume] - flume安装的相关文章

让你系统认识flume及安装和使用flume1.5传输数据到hadoop2.2

问题导读:1.什么是flume?2.如何安装flume?3.flume的配置文件与其它软件有什么不同?一.认识flume1.flume是什么?这里简单介绍一下,它是Cloudera的一个产品2.flume是干什么的?收集日志的3.flume如何搜集日志?我们把flume比作情报人员(1)搜集信息(2)获取记忆信息(3)传递报告间谍信息flume是怎么完成上面三件事情的,三个组件:source: 搜集信息channel:传递信息sink:存储信息上面有点简练,详细可以参考Flume内置channe

flume学习安装

最近项目组有需求点击流日志需要自己收集,学习了一下flume并且安装成功了.相关信息记录一下. 1)下载flume1.5版本 wget http://www.apache.org/dyn/closer.cgi/flume/1.5.0.1/apache-flume-1.5.0.1-bin.tar.gz 2) 解压flume1.5 tar -zxvf apache-flume-1.5.0.1-bin.tar.gz 3) 配置环境变量 jdk已装 export FLUME_HOME=/XXX/XX/a

日志采集框架Flume的安装及使用

日志采集框架Flume的安装及使用 1.Flume介绍 1.1.Flume概述 Flume是一个分布式.可靠.和高可用(旧版Flume og才有高可用)的海量日志采集.传输和聚合的系统. Flume可以采集文件,socket数据包等各种形式源数据, 又可以将采集到的数据输出到HDFS.hbase.hive.kafka等众多外部存储系统中 一般的采集需求,通过对flume的简单配置即可实现 Flume针对特殊场景也具备良好的自定义扩展能力,因此,flume可以适用于大部分的日常数据采集场景 1.2

Flume单机安装与配置

下载 apache-flume-1.6.0-bin.tar.gz 解压 tar -zxvf apache-flume-1.6.0-bin.tar.gz 配置 cp conf/flume-conf.properties.template conf/flume-conf.properties cp conf/flume-env.sh.template conf/flume-env.sh flume-env.sh # Enviroment variables can be set here. expo

Flume的安装与配置

Flume的安装与配置 一.       资源下载 资源地址:http://flume.apache.org/download.html 程序地址:http://apache.fayea.com/flume/1.6.0/apache-flume-1.6.0-bin.tar.gz 源码地址:http://mirrors.hust.edu.cn/apache/flume/1.6.0/apache-flume-1.6.0-src.tar.gz 二.       安装搭建 (1)编译好的包: 直接在安装

apache flume agent安装

1.Flume Agent安装(采用spoolDir模式以便获取系统.应用等日志信息) 注:使用jyapp用户安装 一台虚拟机部署了多个JAVA应用同时需要部署多个flume-agent进行监控时, 需要调整如下配置文件: a    flume-agent/conf/app.conf中的spool_Dir参数 b    flume-agent/conf/flume-env.sh中的jmxremote.port参数 c    logback.xml中fileNamePattern参数 d    f

apache flume collector 安装

2.Flume Collector安装(通过extends AbstractSink implements Configurable,直接写入数据库) 2.1 安装环境 系统: CentOS release 6.6 软件: flume-collector.tar.gz 2.2 安装步骤 2.2.1 部署Flume Collector 具体脚本(jyapp用户): cd  /home/jyapp tar  -zxvf  flume-collector.tar.gz cd  flume-collec

Flume的安装部署

1.Flume的安装非常简单,只需要解压即可,当然,前提是已有hadoop环境 上传安装包到数据源所在节点上 然后解压  tar -zxvf apache-flume-1.6.0-bin.tar.gz 然后进入flume的目录,修改conf下的flume-env.sh,在里面配置JAVA_HOME 2.根据数据采集的需求配置采集方案,描述在配置文件中(文件名可任意自定义) 3.指定采集方案配置文件,在相应的节点上启动flume agent 先用一个最简单的例子来测试一下程序环境是否正常 1.先在

02_ Flume的安装部署

一.Flume的安装部署: Flume的安装非常简单,只需要解压即可,当然,前提是已有hadoop环境 安装包的下载地址为:http://www-us.apache.org/dist/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz 1. 上传安装包到数据源所在节点上; 2. 然后解压:tar -zxvf apache-flume-1.6.0-bin.tar.gz -C /usr/local/src/ 3. 然后进入flume的目录,修改conf下的flume-

Flume NG安装部署及数据采集测试

转载请注明出处:http://www.cnblogs.com/xiaodf/ Flume作为日志收集工具,监控一个文件目录或者一个文件,当有新数据加入时,采集新数据发送给消息队列等. 1 安装部署Flume 若要采集数据节点的本地数据,每个节点都需要安装一个Flume工具,用来做数据采集. 1.1 下载并安装 到官网去下载最新版本的Flume 下载地址为:http://flume.apache.org/,目前最新版本为1.6.0,需要1.7及以上版本的JDK. 1.解压 tar -xzvf ap