Elasticsearch-使用映射来定义各种文档

ES-使用映射来定义各种文档

每篇文档属于一种类型,而每种类型属于一个索引。从数据的逻辑划分来看,可以认为索引是数据库,而类型是数据库中的表。
类型包含了映射中每个字段的定义。映射包括了该类型的文档中可能出现的所有字段,并告诉ES如何索引一篇文档的多个字段。

类型只提供逻辑上的分离:
在ES中,不同类型的文档没有物理上的分离。在同一个ES索引中的所有文档,无论何种类型,都是存储在属于相同分片的同一组文件中。一份分片就是一个Lucene的索引,类型的名称是Lucene索引中一个字段。所有映射的所有字段都是Lucene索引中的字段。
类型的概念是针对ES的一层抽象,但不属于Lucene。可以轻松地在同一个索引中拥有不同类型的文档。ES负责分离这些文档,在某个类型中搜索时,ES会过滤出属于哪个类型的文档。
当多个类型中出现同样的字段名称时,两个同名的字段应该有同样的设置。否则,ES将很难分辨查询时指的是两个字段中的哪一个。两个字段都是属于同一个Lucene索引。

group(分组)和event(活动)存储在不同的类型中。ES允许在一个类型、多个类型中搜索。

1. 检索和定义映射

1.1获取目前的映射

为了查看某个字段类型当前的映射,向该类型URL的_mapping接口发送一个HTTP GET请求

FengZhendeMacBook-Pro:bin FengZhen$ curl ‘localhost:9200/music/singer/_mapping?pretty‘
{
"music" : {
"mappings" : {
"singer" : {
"properties" : {
"level" : {
"type" : "string"
},
"name" : {
"type" : "string"
}
}
}
}
}
}

新建一个专辑类型album,并索引一篇新文档

FengZhendeMacBook-Pro:bin FengZhen$ curl -XPUT ‘localhost:9200/music/album/1‘ -d ‘{
> "name":"八度空间",
> "date":"2003-10-25T19:00"
> }‘

获取当前类型映射

FengZhendeMacBook-Pro:bin FengZhen$ curl ‘localhost:9200/music/album/_mapping?pretty‘
{
"music" : {
"mappings" : {
"album" : {
"properties" : {
"date" : {
"type" : "date",
"format" : "strict_date_optional_time||epoch_millis"
},
"name" : {
"type" : "string"
}
}
}
}
}
}

可看到date字段自动识别为日期类型

1.2定义新的映射

在索引music的album类型中,新增一个字段映射singer,类型为string

FengZhendeMacBook-Pro:bin FengZhen$ CURL -XPUT ‘localhost:9200/music/_mapping/album‘ -d ‘{
> "album":{
> "properties":{
> "singer":{
> "type":"string"
> }
> }
> }
> }‘

查看album的映射

FengZhendeMacBook-Pro:bin FengZhen$ curl ‘localhost:9200/music/album/_mapping?pretty‘
{
"music" : {
"mappings" : {
"album" : {
"properties" : {
"date" : {
"type" : "date",
"format" : "strict_date_optional_time||epoch_millis"
},
"name" : {
"type" : "string"
},
"singer" : {
"type" : "string"
}
}
}
}
}
}

2.扩展现有的映射

如果在现有的基础上再设置一个映射,ES会将两者合并。如上述映射,包含两个来自初始映射的字段,外加定义的一个新字段。随着新字段的加入,初始的映射被扩展了,在任何时候都可以进行这样的操作,ES将次称为现有映射和先前提供的映射的合并。
但是,并非所有的合并都是奏效的,例如:无法改变现有字段的数据类型,而且通常无法改变一个字段被索引的方式。
试图改变singer类型为long,操作会失败并抛出异常

FengZhendeMacBook-Pro:bin FengZhen$ CURL -XPUT ‘localhost:9200/music/_mapping/album?pretty‘ -d ‘{
> "album":{
> "properties":{
> "singer":{
> "type":"long"
> }
> }
> }
> }‘

{
"error" : {
"root_cause" : [ {
"type" : "illegal_argument_exception",
"reason" : "mapper [singer] of different type, current_type [string], merged_type [long]"
} ],
"type" : "illegal_argument_exception",
"reason" : "mapper [singer] of different type, current_type [string], merged_type [long]"
},
"status" : 400
}

避免这个错误唯一的方法是重新索引album里的所有数据,步骤如下
(1) 将album类型里的所有数据删除。
(2) 设置新的映射
(3) 再次索引所有的数据

原文地址:https://www.cnblogs.com/EnzoDin/p/11070637.html

时间: 2024-11-10 01:18:14

Elasticsearch-使用映射来定义各种文档的相关文章

ElasticSearch(二):文档的基本CRUD与批量操作

ElasticSearch(二):文档的基本CRUD与批量操作 学习课程链接<Elasticsearch核心技术与实战> Create 文档 支持自动生成文档_id和指定文档_id两种方式. 通过调用POST index_name/_doc,系统会自动生成文档 _id. #create document. 自动生成 _id POST users/_doc { "user" : "Mike", "post_date" : "2

elasticsearch 5.x 系列之六 文档索引,更新,查询,删除流程

一.elasticsearch index 索引流程 步骤: 客户端向Node1 发送索引文档请求 Node1 根据文档ID(_id字段)计算出该文档应该属于shard0,然后请求路由到Node3的P0分片上. Node3在P0上执行了请求.如果请求成功,则将请求并行的路由至Node1,Node2的R0上.当所有的Replicas报告成功后,Node3向请求的Node(Node1)发送成功报告,Node1再报告至Client. 当客户端收到执行成功后,操作已经在Primary shard和所有的

Elasticsearch Java API(九)--删除文档的field以及field的属性

一.需求 项目中需要实现删除文档的一个field以及删除指定field的一个属性. 以文档test/document/1为例: { "_index": "test", "_type": "document", "_id": "1", "_score": 1, "_source": { "class": "com.tes

ElasticSearch学习之——基本的文档CURD

一.文档的添加 POST http://127.0.0.1:9200/{index}/{type}/{id} { "key":"value", "key2":"value2", "key2":"value2", } 这是最基本的一个文档添加语句{index}表示添加的索引如果没有回自动建立(可以理解为数据库),{type}标示类型如果没有回自动建立(可以理解为表),{id}标示添加文档的

elasticsearch 路由文档到分片

路由文档到分片 当你索引一个文档,它被存储在单独一个主分片上.Elasticsearch是如何知道文档属于哪个分片的呢?当你创建一个新文档,它是如何知道是应该存储在分片1还是分片2上的呢? 进程不能是随机的,因为我们将来要检索文档.事实上,它根据一个简单的算法决定: shard = hash(routing) % number_of_primary_shards routing值是一个任意字符串,它默认是_id但也可以自定义.这个routing字符串通过哈希函数生成一个数字,然后除以主切片的数量

Elasticsearch 管理文档

ES支持近实时的索引.更新.查询.删除文档,近实时就意味着刚刚索引的数据需要1秒钟后才能搜索到,这也是与传统的SQL数据库不同的地方. 更多的ES文档资料参考:Elasticsearch官方文档翻译 索引/替换文档 之前已经试过如何索引一个文档了,这里再复习一下: curl -XPUT 'localhost:9200/customer/external/1?pretty' -d ' { "name": "John Doe" }' 上面的例子中,创建了一个索引为cus

ElasticSearch 面向文档性

在应用程序中对象很少只是一个简单的键和值的列表.通常,它们拥有更复杂的数据结构,可能包括日期.地理信息.其他对象或者数组等. 也许有一天你想把这些对象存储在数据库中.使用关系型数据库的行和列存储,这相当于是把一个表现力丰富的对象挤压到一个非常大的电子表格中:你必须将这个对象扁平化来适应表结构--通常一个字段>对应一列--而且又不得不在每次查询时重新构造对象. Elasticsearch 是 面向文档 的,意味着它存储整个对象或 文档_.Elasticsearch 不仅存储文档,而且 _索引每个文

007-elasticsearch【一】概述、Elasticsearch 访问方式、Elasticsearch 面向文档、常用概念

一.概述 Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene™ 基础之上. Elasticsearch 也是使用 Java 编写的,它的内部使用 Lucene 做索引与搜索,但是它的目标是使全文检索变得简单, 通过隐藏 Lucene 的复杂性,取而代之的提供一套简单一致的 RESTful API. 然而,Elasticsearch 不仅仅是 Lucene,并且也不仅仅只是一个全文搜索引擎. 它可以被下面这样准确的形容: 一个分布式的实时文档存储

电商项目实战(架构七)——Mongodb实现文档操作

一.前言 对于频繁读写的功能,例如商品的浏览记录,Mongodb中的添加.删除.查询可以很好的解决.Mongodb是为快速开发互联网Web应用而构建的数据库系统,其数据模型和持久化策略就是为了构建高 读/写 吞吐量和高自动灾备伸缩性的系统. 二.Mongodb的安装和使用(windows系统下) 1.下载Mongodb安装包,下载地址:https://fastdl.mongodb.org/win32/mongodb-win32-x86_64-2008plus-ssl-3.2.21-signed.