ElasticSearch 基本概念

Elasticsearch是一个接近实时的搜索平台,就是说从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟,通常是一秒钟

  1. 集群

    一个集群通常有一个或多个elasticsearch节点组成,给这些节点指定相同的集群名称,从而形成了一个集群。

  2. 节点

    节点是集群的一部分,参与集群的索引和搜索功能,每个节点也拥有自己的节点名称,一个节点可以通过配置集群名称的方式来加入一个指定的集群
  3. 索引

    一个索引通常包含很多文档类型,索引的名字必须是完全小写的字母,可以把索引当做关系型数据库里的数据库的概念

    在一个集群里可以定义多个索引。

  4. 文档类型

    文档类型可以比作关系型数据库的表,在单个索引下面,你可以定义多种文档类型。

  5. 文档

    文档可以比作关系型数据库里的一条记录,一张表包含多条记录和一种文档类型下面包含多个文档是相似的概念。只不过这里的文档以Json文档的格式保存
  6. 分片

    在ElasticSearch中,单个索引可以存储超过单个节点硬盘容量的大量数据,如何实现的呢,ElasticSearch的办法就是把索引切分成多份,每一份就是一个分片,

    每一个分片就是一个功能完整且独立的Lucene索引,可以被放置到集群下面的任一个节点上,

  7. 复制品(Replication)

ElasticSearch允许你给你的主分片分配一个或多个分片拷贝,主要作用是两点:

1,在分片/节点失败的情况下,提供了高可用性,基于这一点考虑,不要把主分片和复制分片放在同一个节点上

2,扩展你的搜索量/吞吐量,因为搜索可以在所有的复制上并行运行

每个索引下面主分片和复制分片的数量可以在创建索引的时候指定,一旦索引被创建以后,你可以在任何时候调整复制分片的数量,

但是你事后不能改变主分片的数量,

默认情况下,Elasticsearch中的每个索引被分片5个主分片和1个复制,这意味着,如果你的集群中至少有两个节点,

你的索引将会有5个主分片和另外5个复制分片(1个完全拷贝),这样的话每个索引总共就有10个分片

时间: 2024-10-13 02:15:05

ElasticSearch 基本概念的相关文章

ElasticSearch 全文检索— ElasticSearch 核心概念

ElasticSearch核心概念-Cluster 1)代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的. 2)主节点的职责是负责管理集群状态,包括管理分片的状态和副本的状态,以及节点的发现和删除. 3)注意:主节点不负责对数据的增删改查请求进行处理,只负责维护集

Elasticsearch入门教程(二):Elasticsearch核心概念

原文:Elasticsearch入门教程(二):Elasticsearch核心概念 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/vbirdbest/article/details/79200022 基本概念介绍 Elasticsearch是一个基于Lucene构建的开源.分布式.RESTful的搜索引擎,能够实现近实时(NRT)搜索,稳定.可靠.安装方便.Elasticsearch 不

lucene和ElasticSearch基本概念

lucene基本概念 索引(Index) 对应一个倒排表,一个检索的基本单位.在lucene中就对应一个目录. lucene基本概念 段(Segment) 一个索引可以包含多个段,段与段之间是独立的,添加新文档可以生成新的段,不同的段可以合并.段是索引数据存储的单元. 文档(Document) ?文档是我们建索引的基本单位,不同的文档是保存在不同的段中的,一个段可以包含多篇文档. ?新添加的文档是单独保存在一个新生成的段中,随着段的合并,不同的文档合并到同一个段中. 域(Field) ?一篇文档

Elasticsearch基本概念及核心配置文件详解

Elasticsearch5.X,下列的是Elasticsearch2.X系类配置,其实很多配置都是相互兼容的 1. 配置文件 config/elasticsearch.yml 主配置文件 config/jvm.options jvm参数配置文件cofnig/log4j2.properties 日志配置文件 2. 基本概念 接近实时(NRT) Elasticsearch 是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个很小的延迟(通常是 1 秒). 集群(clus

分布式搜索elasticsearch 基本概念

ElasticSearch官网:http://www.elasticsearch.org/ 先上一张elasticsearch的整体框架图: ElasticSearch是基于Lucene开发的分布式搜索框架,包括例如以下特性: 分布式索引.搜索 索引自己主动分片.负载均衡 自己主动发现机器.组建集群 支持Restful 风格接口 配置简单等. 下图是ElasticSearch的第三方插件管理工具.通过它能够非常清晰的看到它索引分布的情况:哪块分布在那里,占用空间多少都能够看到.而且能够管理索引.

ElasticStack学习(三):ElasticSearch基本概念

1.文档 1)ElasticSearch是面向文档的,文档是所有可搜索数据的最小单位.例如: a)日志文件中的日志项: b)一张唱片的详细信息: c)一篇文章中的具体内容: 2)在ElasticSearch中,文档会被序列化成Json格式: a)Json对象是由字段组成的: b)每个字段都有对应的字段类型(如:字符串.数值.日期类型等): 3)每个文档都有一个唯一的ID(Unique ID) a)可以自己指定此ID: b)也可以通过ElasticSearch自动生成: 4)我们可以将文档理解成关

elasticsearch基本概念

NRT(近实时搜索) Elasticsearch是一个NRT平台.这意味着当你索引一个文件时,在细微的延迟(通常1s)之后,该文件才能被搜索到. Cluster(集群) cluster是在所有节点中保存全部数据且提供联合索引和搜索功能的一个或多个节点(服务器)的集合. 每个cluster有唯一的名称,默认为”elasticsearch”.该名称很重要,因为如果节点通过cluster名称加入cluster,那么该节点就只能成为该cluster的一部分.确保在不同环境中不重复使用相同的cluster

elasticsearch基础概念

接近实时(NRT)        Elasticsearch是一个接近实时的搜索平台.这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒).           集群(cluster)        一个集群就是由一个或多个节点组织在一起,它们共同持有你整个的数据,并一起提供索引和搜索功能.一个集群由一个唯一的名字标识,这个名字默认就是“elasticsearch”.这个名字是重要的,因为一个节点只能通过指定某个集群的名字,来加入这个集群.在产品环境中显式地设定这个名字

Elasticsearch 重要概念小计

核心数据类型 text & keyword Text: 1:支持分词,全文检索,支持模糊.精确查询,不支持聚合,排序操作; 2:test类型的最大支持的字符长度无限制,适合大字段存储: 使用场景: 存储全文搜索数据, 例如: 邮箱内容.地址.代码块.博客文章内容等. 默认结合standard analyzer(标准解析器)对文本进行分词.倒排索引. 默认结合标准分析器进行词命中.词频相关度打分. keyword: 1:不进行分词,直接索引,支持模糊.支持精确匹配,支持聚合.排序操作. 2:key