原文链接:https://yq.aliyun.com/articles/57420
摘要: Elk是Elastic search, Logstash和Kibana三者的简称。 Elastic search顾名思义是致力于搜索,它是一个弹性搜索的技术平台,与其相似的有Solr,二者的对比可参考下面这篇文章: Elastic search与Solr选型 总结一下就是,如果你不喜欢夜店咖还是喜欢忠实可靠的老婆,那选Elastic search准没错,何况他还有那么一点
Elk是Elastic search, Logstash和Kibana三者的简称。
Elastic search顾名思义是致力于搜索,它是一个弹性搜索的技术平台,与其相似的有Solr,二者的对比可参考下面这篇文章:
Elastic search与Solr选型
总结一下就是,如果你不喜欢夜店咖还是喜欢忠实可靠的老婆,那选Elastic search准没错,何况他还有那么一点美。目前运用ES的案例也不少了,比如it屌丝们都爱的Git hub以及我D痛恨的Wiki。
Logstash,也可以顾名思义一下,stash的意思是藏匿处,所以……其实并不完全准确,Logstash是用来做日志采集,藏匿几乎就不由他管了,藏匿由谁管呢,聪明的看官肯定能猜到是ES了。但是这也不完全准确,在ELK的运维环境中肯定是ES没跑了,不过Logstash支持各种输出源,包括redis,s3,mongodb以及kafka,甚至对于情怀粉(不嘛,人家就喜欢刺刀,不要枪炮,拼刀才爷们)吧,还贴心的支持http的远程写文件方案。总之我们能想到的,作者也想到了,我们没能想到的,作者也想到了,如果有作者没能写到的,那也没关系,你可以自己写插件。什么?你写不出来?写不出来就不要瞎bb,找个现成能用的。相对应的,ES也支持各种输入源,从基本的stdin到file到redis到……
Kibana,呃,羔羊肉饼。估计作者是个洋鬼子北京情怀蜜吧,代码写多了,看着掉了一地的头发,想着要是能吃份东来顺的铜锅涮羊肉多好,然后取了这鬼名字吧。Kibana主要是用于ES分析和查询。Elk里本来完全可以不用带他的,用用ES的head和bigdesk插件也蛮好,不过Kibana的管理和查询用起来确实方便很多,人嘛,有枪炮用何必非要用刺刀,默默想到楼主的前东家。
那个奶妈形态的德鲁伊就是Logstash,agent只是Logstash承担的一个角色,与此对应的是indexer。agent会分别将各自获取的日志作为输入输出到一个消息代理(例如redis或者kafka),indexer会将消息代理作为输入再输出到ES上,由ES做indexing。其实Logstash在整个过程中只负责输入输出,对Logstash而言并没有agent和index之分。如果日志量小的话完全不需要设置indexer,直接将ES作为agent的输出源。
Elastic search
环境准备:
Jdk7及以上,Logstash2.1明确只支持Jdk7。
Elastic search, Kibana, Logstash下载地址
ES不能以root权限启动。
楼主的环境;
10.0.250.90 9200 9300
10.0.250.90 9201 9301
10.0.250.90 9200 9300
第一个端口是对外提供http服务的接口,第二个端口是集群交换协议的端口。
cd /opt/elasticsearch-2.1.0/config
vim elasticsearch.yml
以10.0.250.90 9200 9300为例。
修改集群名称,ES默认通过广播发现节点,所有在广播里声明为同一个集群名称的节点都会被自动加入集群中。
cluster.name: es
设置节点名称
node.name: es-node-2
````
此外可以通过node.master设置节点是否可以被推举为leader以及node.data设置节点是否保存索引数据。
节点的定制化属性信息,我把三个节点设成r1-r3
<div class="se-preview-section-delimiter"></div>
node.rack: r2
数据存储目录
<div class="se-preview-section-delimiter"></div>
path.data: /usr/local/data/
日志目录,默认生成的日志文件是${cluster.name}_xxx,可以通过logging.yml修改
<div class="se-preview-section-delimiter"></div>
path.logs: /var/log/es/
启动时是否就锁住内存,es是基于java,遵循java的内存回收,java内存分配一般会设定一个最小值(-Xms)和一个最大值(-Xmx),这样虽然能在空闲时节约内存,但是却会带来频繁的gc。所以es建议在启动时就锁定内存,并且es建议将主机一半可用内存分配给它。
<div class="se-preview-section-delimiter"></div>
bootstrap.mlockall: true
绑定网络地址,默认是127.0.0.1。可以通过transport.tcp.port设置项设置几圈交换协议的端口。
<div class="se-preview-section-delimiter"></div>
network.host: 10.0.250.91
http.port: 9200
1. 设置初始化时的发现列表,新节点会通过单播的方式发现列表里的节点。
2. 设置有master资格的节点最小个数,低于这个个数可能会发生脑裂。es建议的个数是所有节点数/2+1。
所谓脑裂是指集群中有多个active的master节点,这样就导致多个节点接管集群服务。举个例子:
假设A,B,C三个节点都有master资格,A节点为active,其他未standby,但是A节点出了故障,这时B,C就要进行投票选出新的leader,此时的结果就可能会是B和C都互有两票,量个节点都分别active。
这里只是描述脑裂成因,和ES的脑裂成因并不完全一样,ES的投票机制应该是类似于redis先到先得的那种。不过配置上最好遵从es的建议。
<div class="se-preview-section-delimiter"></div>
discovery.zen.ping.unicast.hosts: [“10.0.250.90:9300”, “10.0.250.91:9300”]
discovery.zen.minimum_master_nodes: 2
配置完以后,启动elastic
<div class="se-preview-section-delimiter"></div>
bin/elasticsearch
curl http://10.0.250.91:9200
curl http://10.0.250.91:9200/_nodes
通过curl命令查看下节点状态以及整个集群的节点状态。
推荐安装head插件,可以查看集群状态
<div class="se-preview-section-delimiter"></div>
bin/plugin install mobz/elasticsearch-head
bigdesk插件在当前版本上无法使用,因为ES通过Rest接口返回的json数据不标准,jquery会出parse错误。
通过浏览器访问http://10.0.250.91:9200/_plugin/head
![节点状态](http://img.blog.csdn.net/20151226175252443)
<div class="se-preview-section-delimiter"></div>
## Kibana ##
Kibana的安装也很简单,下载最新版本并安装。
我安装在251主机上。
<div class="se-preview-section-delimiter"></div>
vim config/kibana.yml
设置Kibana端口
<div class="se-preview-section-delimiter"></div>
server.port: 5601
设置提供rest查询服务的ES节点,设置了后Kibana就会通过这个节点查询信息了。
<div class="se-preview-section-delimiter"></div>
elasticsearch.url: “http://10.0.250.90:9200”
设置Kibana自用索引,主要用来存储Kibana保存的一些内容,例如查询信息,报表等
<div class="se-preview-section-delimiter"></div>
kibana.index: “.eslogs”
启动Kibana
<div class="se-preview-section-delimiter"></div>
bin/kibana
访问Kibana,第一次使用时会让你建logstash的索引规则,默认为logstash-*,*代表日期,每天会生成一个新的索引。
<div class="se-preview-section-delimiter"></div>
## Logstash ##
Logstash的安装非常简单,下载最新版本并安装,我用的是2.1.1.
<div class="se-preview-section-delimiter"></div>
bin/logstash -e ”
-e ‘‘会默认以stdin作为输入,以stdout作为输出。
我在控制台输入11111,控制台就输出了格式化的输出。
<div class="se-preview-section-delimiter"></div>
11111
{
“message” => “11111”,
“@version” => “1”,
“@timestamp” => “2015-12-26T10:00:23.422Z”,
“type” => “stdin”,
“host” => “0.0.0.0”
}
接着,我们再测试一下以ES作为输出源,在ES根目录下:
<div class="se-preview-section-delimiter"></div>
mkdir config
touch logstash-indexer.conf
vim logstash-indexer.conf
修改logstash-indexer.conf定义输入源为stdin,输出为stdout以及ES.
<div class="se-preview-section-delimiter"></div>
input {
stdin{
type=> “stdin-input”
}
}
output {
stdout { codec=> rubydebug }
elasticsearch {
hosts=> [“10.0.250.90:9200”]
codec=> “json”
}
}
启动Logstash
<div class="se-preview-section-delimiter"></div>
bin/logstash -f config/logstash-indexer.conf -l /var/log/logstash/logstash.log
“`
输入“hello this a test message”然后回车
在Kibana那就能看到对应的日志信息