ElasticStack系列之二十 & 数据均衡、迁移、冷热分离以及节点自动发现原理与机制

1. 数据均衡

  某个shard分配到哪个节点上,一般来说,是由 ELasticSearch 自行决定的。以下几种情况会触发分配动作:

  • 新索引的建立
  • 索引的删除
  • 新增副本分片
  • 节点增减引发的数据均衡

  在动态分配的时候有几个默认值需要注意,当然对应的这些默认值都是可以修改的,具体如下:

  1. ElasticSearch 默认要求所有分片都正常启动成功以后,才可以进行数据均衡操作,否则的话,在集群重启阶段,会浪费太多的流量
  2. ElasticSearch 默认可以有 2 个任务同时运行数据均衡。如果有节点增减且集群压力不高的情况下,可以适当增大(可通过 cluster.routing.alloction.cluster_concurrent_rebalance 参数来控制)
  3. ElasticSearch 默认可以有 2 个任务同时运行数据恢复操作,前提是除了主分片重启恢复以外的情况下。所以,节点重启时,可以看到主分片迅速恢复完成,副本分片的恢复却很慢。除了副本分片本身数据要通过网络复制以外,并发线程本身也减少一半(默认同时又4个主分片恢复)。当然这种设置也是有道理的--> 主分片一定是本地恢复,副本分片却需要走网络,带宽是有限的。
  4. ElasticSearch 默认当数据磁盘使用量占当前磁盘总空间的 85% 时,新索引分片就不会再分配到这个节点上了。在达到 90% 时,就会触发该节点现存分片的数据均衡,把数据挪到其他节点上去。

2. reroute 接口应用(数据迁移)

  reroute 接口支持三种指令:allocate、move 和 cancel,我们最常用的就是 allocate 和 move 指令。

  allocate 指令:

    因为负载过高等原因,有时候个别分片可能长期处于 unassigned 状态,我们就可以手动分配到指定节点上。默认情况下不允许手动分配副本分片,所以如果是 主分片 故障,我们需要单独加一个 allow_primary 选项:

  

  注意:

    如果是历史数据的话,需要提前确认一下哪个节点上保留有这个分片的实际目录,且目录大小最大,然后手动分配到这个节点上,以此来减少数据的丢失。

  move 指令:

    因为负载过高,磁盘利用率过高,服务器需要下线,更换磁盘等情况。我们此时需要从该节点一走部分分片数据到其他节点上,那么 move 指令就很有用了:

3. 冷热数据读写分离

4. 节点自动发现原理与机制

原文地址:https://www.cnblogs.com/liang1101/p/10177119.html

时间: 2024-10-07 01:52:03

ElasticStack系列之二十 & 数据均衡、迁移、冷热分离以及节点自动发现原理与机制的相关文章

从Exchange 通往Office 365系列(二十)PST迁移测试

除了使用Exchange Online的向导迁移之外,还有一种迁移的方式是使用PST文件迁移,首先在客户端上将数据导出成PST文件,然后在Office 365中创建账户,生成电子邮件地址,之后通过Outlook连接到生成的Office 365账户,将PST文件导入到Office 365账户中,完成迁移,全部迁移完成之后,添加公司域名,将MX记录指向Office 365,这种方法的好处就是不需要公网证书同时也可以迁移日历.联系人.任务等. 下边来看一下具体实施的步骤 1.首先使用Outlook登录

Powershell管理系列(二十六)PowerShell操作之批量导出&导入邮箱

-----提供AD\Exchange\Lync\Sharepoint\CRM\SC\O365等微软产品实施及外包,QQ:185426445.电话18666943750 项目中有时候做跨林邮箱迁移的时候,条件不成熟,比如安全考虑或者其他考虑,不能做双林信任,这样就提出了一个问题,历史邮件需要使用的话怎么办,一个简单高效的解决办法就是从源森林批量导出邮件为.pst文件,在批量导入到目的域森林,具体操作如下: 1.赋予管理账号邮件导入导出权限,命令如下: cls whoami New-Manageme

[算法系列之二十四]后缀树(Suffix Tree)

之前有篇文章([算法系列之二十]字典树(Trie))我们详细的介绍了字典树.有了这些基础我们就能更好的理解后缀树了. 一 引言 模式匹配问题 给定一个文本text[0-n-1], 和一个模式串 pattern[0-m-1],写一个函数 search(char pattern[], char text[]), 打印出pattern在text中出现的所有位置(n > m). 这个问题已经有两个经典的算法:KMP算法 ,有限自动机,前者是对模式串pattern做预处理,后者是对待查证文本text做预处

算法系列之二十四:离散傅立叶变换之音频播放与均衡器

导语 在算法系列的第二十二篇,我们介绍了离散傅立叶变换算法的实现,将时域的音频信号转换到频域进行分析,获取拨号音频的频率特征.这一篇我们将介绍一种频域均衡器的实现方法,所谓的频域均衡器,就是在频域信号的基础上对音频数据进行调整,然后再将频域信号转换成时域信号在回放设备上播放,从而达到音色调节的目的.将频域信号转换成时域信号的算法,就是离散傅立叶逆变换算法. 1 离散傅立叶逆变换 有从时域转换到频域的方法,就必然有从频域转换到时域的方法,相对于离散傅里叶变换,这个反向转换就是离散傅里叶逆变换(ID

ComicEnhancerPro 系列教程二十:用“文件比较”看有损、无损

作者:马健邮箱:[email protected] 主页:http://www.comicer.com/stronghorse/ 发布:2017.07.23 教程二十:用"文件比较"看有损.无损 在前两篇教程中,扯了一大堆JPG文件的有损压缩,平时在网上也经常看到一些人整天把有损.无损挂在嘴边,但具体是否真的无损?有损又损了多少.损在哪里?讲得清的人就真心不多了.CEP从v4.13开始提供"文件比较"功能,可用于定量比较有损.无损. 按照CEP的使用说明,"

《sed的流艺术之二》-linux命令五分钟系列之二十二

本原创文章属于<Linux大棚>博客,博客地址为http://roclinux.cn.文章作者为rocrocket. 为了防止某些网站的恶性转载,特在每篇文章前加入此信息,还望读者体谅. === [正文开始] 上文接:<sed的流艺术之一>-linux命令五分钟系列之二十一 5 sed中有选项么?有没有什么比较常用的? sed最主要的就是command部分,把这部分玩转了,你就已经很厉害了,而玩转这部分的前提是玩转正则表达式.尽管如此,sed的选项部分的-n选项仍然是非常重要,理解

从Exchange 通往Office 365系列(二十五)混合部署概述

前期的准备都完成后,接下来我们就可以来配置混合部署了,首先先来了解下什么是混合部署 本地Exchange可以选择直接迁移到Office 365中,也可以选择配置为混合部署的模式,配置混合部署的模式可以有以下一些好处 内部部署组织与 Exchange Online 组织之间的安全邮件路由. 使用共享域命名空间的邮件路由.例如,内部部署与 Exchange Online 组织都使用 @contoso.com SMTP 域. 统一全局地址列表 (GAL),也称为"共享地址簿". 内部部署组织

轻松学习JavaScript二十:DOM编程学习之获取节点

我们这里所说的获取节点包含元素节点,属性节点和文本节点.通常,通过DOM我们就能够操作HTML元素.为 了做到这件事情,您必须首先找到该元素.W3C提供了比较方便简单的定位节点的方法和属性,以便我们快速的对节 点进行操作. 我们先来写一个简单的HTML文档以供我们进行测试,并且JS代码都是写在window.onload事件中: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w

Hadoop运维记录系列(二十四)

从这篇开始记录一下集群迁移的事情 早先因为机房没地方,就已经开始规划集群搬机房的事情,最近终于开始动手了,我会把这次不停机迁移的过程遇到的主要问题和矛盾以及各种解决方法记录下来. 集群规模说大不大,几百台,总容量30PB左右.Hadoop使用CDH 5.5.1加一些自定义patch的rpm打包编译版本. 总的方案是集群不停机,在两个机房之间架设专线,旧机房decommission,拉到新机房recommission.每天不能下线太多机器,要保证计算. 新机房提前架设90台机器,测试带宽.带宽的测