flume配置参数的意义

1.监控端口数据:

flume启动:

[[email protected] flume]$ bin/flume-ng agent --conf conf/ --name a1 --conf-file job/flume-telnet-logger.conf -Dflume.root.logger=INFO,console

参数说明:

--conf conf/  :表示配置文件存储在conf/目录

--name a1 :表示给agent起名为a1

--conf-file job/flume-telnet.conf :flume本次启动读取的配置文件是在job文件夹下的flume-telnet.conf文件。

-Dflume.root.logger==INFO,console :-D表示flume运行时动态修改flume.root.logger参数属性值,并将控制台日志打印级别设置为INFO级别。日志级别包括:log、info、warn、error。

2.实时读取本地文件导HDFS:

执行监控配置

[[email protected] flume]$ bin/flume-ng agent --conf conf/ --name a2 --conf-file job/flume-file-hdfs.conf

开启Hadoop和Hive并操作Hive产生日志

[[email protected] hadoop-2.7.2]$ sbin/start-dfs.sh

[[email protected] hadoop-2.7.2]$ sbin/start-yarn.sh

[[email protected] hive]$ bin/hive
hive (default)>

3.实时读取本地目录文件导HDFS:

启动监控文件夹命令

[[email protected] flume]$ bin/flume-ng agent --conf conf/ --name a3 --conf-file job/flume-dir-hdfs.conf

说明: 在使用Spooling Directory Source时

1) 不要在监控目录中创建并持续修改文件

2) 上传完成的文件会以.COMPLETED结尾

3) 被监控文件夹每500毫秒扫描一次文件变动

3. 向upload文件夹中添加文件

在/opt/module/flume目录下创建upload文件夹

[[email protected] flume]$ mkdir upload

向upload文件夹中添加文件

[[email protected] upload]$ touch atguigu.txt

[[email protected] upload]$ touch atguigu.tmp

[[email protected] upload]$ touch atguigu.log

原文地址:https://www.cnblogs.com/alexzhang92/p/10884211.html

时间: 2024-08-07 11:33:36

flume配置参数的意义的相关文章

Flume NG 学习笔记(二)单机与集群Flume 配置

下面的内容基本来自官网:http://flume.apache.org/FlumeUserGuide.html 本文使用的是最新版本的apache flume 1.5,安装完Flume然后测试下Flume是否可以用,在Flume目录下用以下语句测试: bin/flume-ng agent -n$agent_name -c conf -f conf/flume-conf.properties.template 结果如图显示: Ok,我们接下去看下面常用架构.功能配置示例 一.最简单的单一代理Flu

Mysql配置文件my.cnf配置及配置参数详解

Mysql配置文件my.cnf 安装了mysql没有my.cnf文件的情况 1.可以把mysql的示例配置文件,如my-medium.cnf拷贝到/etc/my.cnf,再去修改/etc/my.cnf的配置/usr/share/doc/MySQL-server-5.5.38/my-medium.cnf(Example MySQL config file for medium systems with little memory (32M - 64M) ) 可以通过命令:find / -name 

haproxy配置参数详解

一.CentOS 6.6 HAProxy安装配置指南 下面来进行配置文件的详细参数介绍,更多参数还请查看官方手册, 下面贴出我的配置文件,我的实验环境是一台服务器安装了三个tomcat容器,前端用haproxy对三个tomcat负载均衡. #--------------------------------------------------------------------- # Example configuration for a possible web application.  Se

Mysql一些重要配置参数的学习与整理(一)

原文地址:Mysql一些重要配置参数的学习与整理(一) 最近一直在进行mysql的学习,主要是学习mysql的一些配置参数,了解参数的意义,考虑其对mysql性能的影响,向同事要了一份正式服务器上的mysql配置,目前的配置能够满足正式生产环境中的性能要求,在学习mysql的过程中,对该配置中的一些参数进行了解和学习,这里总结和整理一下,方便以后回顾. 其中涉及的配置参数主要有以下几个,接下来会依次进行学习和了解: skip-external-locking 在某些系统中,lockd锁管理器可能

JedisPool的配置参数整理

JedisPool的配置参数大部分是由JedisPoolConfig的对应项来赋值的. maxActive:控制一个pool可分配多少个jedis实例,通过pool.getResource()来获取:如果赋值为-1,则表示不限制:如果pool已经分配了maxActive个jedis实例,则此时pool的状态为exhausted. maxIdle:控制一个pool最多有多少个状态为idle(空闲)的jedis实例: whenExhaustedAction:表示当pool中的jedis实例都被all

samba 配置参数详解

samba 配置参数详解: 一.全局配置参数  workgroup = WORKGROUP说明:设定 Samba Server 所要加入的工作组或者域. server string = Samba Server Version %v说明:设定 Samba Server 的注释,可以是任何字符串,也可以不填.宏%v表示显示Samba的版本号. netbios name = smbserver说明:设置Samba Server的NetBIOS名称.如果不填,则默认会使用该服务器的DNS名称的第一部分

关于ntp时间同步理论及配置参数-20170804

[原创]关于ntp时间同步理论及配置参数20170804 前言 NTP(Network Time Protocol,网络时间协议)是用来使网络中的各个计算机时间同步的一种协议.无论是平时使用的私人计算机还是在工作中搭建的服务器集群,时间的统一性和准确性是十分重要的.它是用来同步网络中各个计算机的时间的协议. 在计算机的世界里,时间非常地重要,例如对于火箭发射这种科研活动,对时间的统一性和准确性要求就非常地高,是按照A这台计算机的时间,还是按照B这台计算机的时间?NTP就是用来解决这个问题的,NT

linux学习笔记——搭建基于nginx的web服务器、多核配置、nginx配置参数

############ 认识nginx #############Nginx:(发音同 engine x)是一款轻量级的Web服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,并在一个BSD-like 协议下发行.由俄罗斯的程序设计师Igor Sysoev所开发,最初供俄国大型的入口网站及搜寻引擎Rambler(俄文:Рамблер)使用.  其优点是轻量级(占有内存少),高并发(并发能力强),事实上nginx的并发能力确实在同类型的网页伺服器中表现较好.目前中国大陆使用ngi

网站前端_KindEditor.基础入门.0001.KindEditor_3.4.2配置参数?

初始方式: 说明: 在快速入门中使用KE.show({ .. .})来初始化了一个编辑器,具体进入js/kindeditor.js下可以看到KE对象下的show方法先调用了KE的init方法然后又调用了其event事件对象的ready方法,内部其实是调用的KE的create方法,传递的参数为args的id属性,所以可通过2种方式来初始化编辑器 # 方式一 : # 方式二 : 注意: 无论使用哪种方式初始化编辑器,都需要传递配置对象{ ... },配置对象中id属性是必须配置的,其它的属性默认采用