elasticsearch高级配置之(一)----分片分布规则设置

Java代码  

  1. cluster.routing.allocation.allow_rebalance

设置根据集群中机器的状态来重新分配分片,可以设置为always, indices_primaries_active和indices_all_active,默认是设置成indices_all_active来减少集群初始启动时机器之间的交互。

Java代码  

  1. cluster.routing.allocation.cluster_concurrent_rebalance

设置在集群中最大允许同时进行分片分布的个数,默认为2,也就是说整个集群最多有两个分片在进行重新分布。

Java代码  

  1. cluster.routing.allocation.node_initial_primaries_recoveries

设置指定初始每个节点。由于多数情况下是使用local的gateway,这应该会更快,

Java代码  

  1. cluster.routing.allocation.node_concurrent_recoveries

设置在节点中最大允许同时进行分片分布的个数,默认为2

Java代码  

  1. cluster.routing.allocation.disable_allocation

使主要分片或副本的分布失效。要知道,如果主分片不存在(那个节点挂了)那么其副本仍然会被提升为主分片,这个设置只有在动态地使用集群更新设置api调用时才生效。

Java代码  

  1. cluster.routing.allocation.disable_replica_allocation

使副本分布失效。和上一个设置一样,只有动态地使用集群更新设置api调用时才生效。

Java代码  

  1. indices.recovery.concurrent_streams

当从一个点(peer)恢复分片时当前节点最多允许的文件读取流的个数,默认为5

自定义分片分布规则

可以通过设置分片的分布规则来人为地影响分片的分布,下面是个例子:

假设我们有几个机架。当我们启动一个节点,我们可以设置一个叫rack_id(其它名字也可以)的属性,例如下面设置:

Java代码  

  1. node.rack_id: rack_one

上面这个例子设置了一个属性叫rack_id,它的值为rack_one。现在,我们要设置rack_id作为分片分布规则的一个属性(在所有节点都要设置)。

Java代码  

  1. cluster.routing.allocation.awareness.attributes: rack_id

上面设置意味着rack_id会用来作为分片分布的依据。例如:我们启动两个
node.rack_id设置rack_one的节点,然后建立一个5个分片,一个副本的索引。这个索引就会完全分布在这两个节点上。如果再启动另外两个
节点,node.rack_id设置成rack_two,分片会重新分布,但是一个分片和它的副本不会分配到同样rack_id值的节点上。可以为分片分
布规则设置多个属性,例如:

Java代码  

  1. cluster.routing.allocation.awareness.attributes: rack_id,zone

注意:当设置了分片分布属性时,如果集群中的节点没有设置其中任何一个属性,那么分片就不会分布到这个节点中。

强制分布规则

更多的时候,我们不想更多的副本被分布到相同分布规则属性值的一群节点上,那么,我们可以强制分片规则为一个指定的值。

例如,我们有一个分片规则属性叫zone,并且我们知道有两个zone,zone1和zone2.下面是设置:

Java代码  

  1. cluster.routing.allocation.awareness.force.zone.values: zone1,zone2
  2. cluster.routing.allocation.awareness.attributes: zone

现在我们启动两个node.zone设置成zone1的节点,然后创建一个5个分片,一个副本的索引。索引建立完成后只有5个分片(没有副本),只有当我们启动node.zone设置成zone2的节点时,副本才会分配到那节点上。

分片分布过滤

允许通过include/exclude过滤器来控制分片的分布。这些过滤器可以设置在索引级别上或集群级别上。下面是个索引级别上的例子:

假如我们有四个节点,每个节点都有一个叫tag(可以是任何名字)的属性。每个节点都指定一个tag的值。如:节点一设置成node.tag:
value1,节点二设置成node.tag:
value2,如此类推。我们可以创建一个索引然后只把它分布到tag值为value1和value2的节点中,可以通过设置

index.routing.allocation.include.tag 为value1,value2达到这样的效果,如:

Java代码  

  1. curl -XPUT localhost:9200/test/_settings -d ‘{
  2. "index.routing.allocation.include.tag" : "value1,value2"
  3. }‘

与此相反,通过设置index.routing.allocation.exclude.tag为value3,我们也可以创建一个索引让其分布在除了tag设置为value3的所有节点中,如:

Java代码  

  1. curl -XPUT localhost:9200/test/_settings -d ‘{
  2. "index.routing.allocation.exclude.tag" : "value3"
  3. }‘

include或exclude过滤器的值都会使用通配符来匹配,如value*。一个特别的属性名是_ip,它可以用来匹配节点的ip地址。

显然,一个节点可能拥有多个属性值,所有属性的名字和值都在配置文件中配置。如,下面是多个节点的配置:

Java代码  

  1. node.group1: group1_value1
  2. node.group2: group2_value4

同样的方法,include和exclude也可以设置多个值,如:

Java代码  

  1. curl -XPUT localhost:9200/test/_settings -d ‘{
  2. "index.routing.allocation.include.group1" : "xxx"
  3. "index.routing.allocation.include.group2" : "yyy",
  4. "index.routing.allocation.exclude.group3" : "zzz",
  5. }‘

上面的设置可以通过索引更新的api实时更新到索引上,允许实时移动索引分片。

集群范围的过滤器也可以定义,可以通过集群更新api实时更新到集群上。这些设置可以用来做让一些节点退出集群的操作。下面是通过ip地址去掉一个节点的操作:

Java代码  

    1. curl -XPUT localhost:9200/_cluster/settings -d ‘{
    2. "transient" : {
    3. "cluster.routing.allocation.exclude._ip" : "10.0.0.1"
    4. }
    5. }‘
时间: 2024-10-29 12:51:13

elasticsearch高级配置之(一)----分片分布规则设置的相关文章

Loggly:提高ElasticSearch性能的九个高级配置技巧

Loggly日志管理服务在其很多核心功能里使用ElasticSearch作为搜索引擎.Jon Gifford在其文章“ElasticSearch vs Solr”中指出,日志管理领域对搜索技术有了更高的要求.总的来说,它必须能够: 可靠地进行大规模实时索引-对我们来说,每秒处理10万条以上日志数据: 高性能.可靠地处理同一索引上的高并发搜索请求. 当我们搭建Gen2日志管理服务时,我们对ElasticSearch的各项配置信息进行了反复研究,以便能获得索引和搜索的最高性能.不幸的是,这些配置项散

存储学习之--StarWind高级配置(设置Client访问规则)

存储学习之--StarWind高级配置(设置Client访问规则)      默认的StarWind允许所有的Client都可以访问iscsi target,可以结合Windows防火墙,建立安全的访问规则,指定只有经过认证的Client才可以访问! 一.配置访问规则 添加新的访问规则 允许指定的ip可以访问 添加源主机(ip) 默认允许访问所有的Target,也可以指定访问指定的Target 访问规则建立成功 二.配置Windows防火墙 选择防火墙的高级配置 允许通过指定port访问 允许访

Elasticsearch 基础理论 & 配置调优

一.简介 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎. 它不但包括了全文搜索功能,还可以进行以下工作: 分布式实时文件存储,并将每一个字段都编入索引,使其可以被搜索. 实时分析的分布式搜索引擎. 可以扩展到上百台服务器,处理PB级别的结构化或非结构化数据. 使用案例: 维基百科使用Ela

Cisco ASA 高级配置

Cisco ASA 高级配置 一.防范IP分片攻击 1.Ip分片的原理: 2.Ip分片的安全问题: 3.防范Ip分片. 这三个问题在之前已经详细介绍过了,在此就不多介绍了.详细介绍请查看上一篇文章:IP分片原理及分析. 二.URL过滤 利用ASA防火墙IOS的特性URL过滤可以对访问的网站域名进行控制,从而达到某种管理目的. 实施URL过滤一般分为以下三个步骤: (1) 创建class-map (类映射),识别传输流量. (2) 创建policy-map (策略映射),关联class-map.

ELK 学习笔记之 elasticsearch elasticsearch.yml配置概述

elasticsearch.yml配置概述: 设置集群名字 cluster.name 定义节点名称 node.name 节点作为master,但是不负责存储数据,只是协调. node.master: true node.data: false 子节点,存储数据 node.master: false node.data: true 该节点是一个负载均衡器,什么都不做 node.master: false node.data: false 分片数 index.number_of_shards 副本数

ElasticSearch 安装配置

1.   Elasticsearch5.5.2安装 1.1.Elasticsearch安装步骤 #安装之前需安装java 环境,并配置JAVA_HOME环境变量 #直接下载Elasticsearch-5.5.2 稳定版的.tar.gz包 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.2.tar.gz #下载完成后,发布SHA签名 sha1sum elasticsearch-5.5.2.tar

Elasticsearch 集群分配多少分片合理

https://www.jianshu.com/p/297e13045605 Elasticsearch 是一个非常通用的平台,支持各种用户实例,并为组织数据和复制策略提供了极大的灵活性.但是,这种灵活性有时会使我们很难在早期确定如何很好地将数据组织成索引和分片,尤其是不熟悉 Elastic Stack.虽然不一定会在首次启动时引起问题,但随着数据量的增长,它们可能会导致性能问题.群集拥有的数据越多,纠正问题也越困难,因为有时可能需要重新索引大量数据.      因此,当我们遇到性能问题时,往往

ElasticSearch 如何合理分配索引分片

Elasticsearch 是一个非常通用的平台,支持各种用户实例,并为组织数据和复制策略提供了极大的灵活性.但是,这种灵活性有时会使我们很难在早期确定如何很好地将数据组织成索引和分片,尤其是不熟悉 Elastic Stack.虽然不一定会在首次启动时引起问题,但随着数据量的增长,它们可能会导致性能问题.群集拥有的数据越多,纠正问题也越困难,因为有时可能需要重新索引大量数据.      因此,当我们遇到性能问题时,往往可以追溯到索引方式以及集群中分片的数量.那么就会遇到问题,我们应该有多少分片以

证书解析(二):windows 2012 r2证书服务安装与高级配置

本着应用隔离的原则,建议把证书服务部署在一台独立的windows server 2012 r2虚拟机之中.证书服务器可以不用考虑高可用,因证书服务宕掉后,除了不能继续颁发证书和不能访问证书吊销信息,并不影响证书的其他验证. 证书服务的安装 证书服务的安装很简单,运行服务器管理器,添加角色与功能,选择"Active Directory证书服务", 在角色服务中选择"证书颁发机构"与"证书颁发机构WEB注册" (不是证书注册web服务)两项,证书颁发