Lucene是如何理解文档的 & 文档类型(Types)是如何被实现的

Lucene是如何理解文档的

在Lucene中,一份文档(Document)由一系列简单的字段-值(field-value)对组成。一个字段必须有值,同时允许包含多值。同样的,一个单一的字符串在分析处理过程中可能被转换成多个值。Lucene不关心值到底是字符串、数字还是日期——所有的值都以不可理解的比特值(opaque)对待。

当我们在Lucene中索引一份文档时,值和字段在反向索引(inverted index)中被关联起来。可选项的是,是否将原始值存储起来以便今后使用,存储后的值是不可更改的。

文档类型(Types)是如何被实现的

Elasticsearch的类型实现在简单的基础设施之上。一个索引可能存在多种类型,每种类型都有自己的mapping(类型数据库的schema)。同时同一类型下的每份文档都被存储在相同的索引里。

由于Lucene没有文档类型的概念,文档的类型名被存储在文档的一个被称为_type的元数据中。当我们在搜索某种类型的文档,Elasticsearch只是简单地使用该类型的值在_type字段上进行过滤。

Lucene也没有mapping的概念。Mapping是Elasticsearch的一个层,将复杂的JSON文档映射到Lucene能处理的简单的扁平的文档。

Lucene是如何理解文档的 & 文档类型(Types)是如何被实现的

时间: 2024-08-24 18:26:12

Lucene是如何理解文档的 & 文档类型(Types)是如何被实现的的相关文章

如何快速阅读并理解英文的技术文档

作为一名程序员,要实现我们的产品,首先需要选择一种或几种编程语言,其次是使用各种工具和第三方库. 而在这个过程中,就少不了对这些语言.工具和第三方库的下载和学习. 下载一般都非常简单,但是关于如何使用,相信大家都会有各种各样的学习方法. 但是不管通过什么方式,追根溯源都会来到官方文档. 那么问题就来了!目前来说,大部分的官方文档都是英文的,如何才能快速的理解并使用官方文档呢? 今天,把自己的学习方法拿出来,和大家一起分享一下,希望大家可以尽量少走一些弯路,尽快的找到bug的解决方法. 说起来很简

仿百度文库、豆丁文档在线文档带全套工具

这个是非常棒的一套在线文档分享系统源码,仿百度文库.豆丁文档网站源码,在这里完全免费提供给大家学习.在这里无需任何币就可以下载到非常多的精品源码,如果觉得好站长资源做的不错,请帮忙推荐给更多的站长朋友,并且里面还有一个设置说明图.    此套源码非常干净的,不像现在很多所谓VIP源码论坛放大量的垃圾广告文件在里面,更没有在里面加入垃圾加密广告代码.    安装以下软件前,先要在本机装好OFFICE2007   net2.0以上    windows2003 系统   退掉杀毒软件切忌! 1:安装

稻米文档助手——文档库01

稻米文档助手——文档库01已经提供下载了. 主要收集的是C++/Win32/MFC方面的资料. 文档库下载地址:Part1: http://download.csdn.net/detail/lifeandc/8421437 Part2: http://download.csdn.net/detail/lifeandc/8421451 下载解压后,通过选择 开始-->文档库页面的 添加 命令,添加文档库即可使用.

Word 主控文档与子文档(免费课程资料)

课程简介:Word中的主控文档与子文档这个功能,对于大部分人来说,应该是不太了解的,不了解就更谈不上应用了.这也是制作这个视频课程的目的,希望更多的人能够了解并在需要时能真正应用到工作中.那在什么时候能用到这个功能呢?当有一个大文档需要拆分成多个小文档分工合作时:当你正在写一本书或写一篇论文想一章保存为一个文档,最后再把所有的小文档合并成一个大文档来组织管理时,这个功能就非常有意义了.这个视频课程主要讲了如何创建主控文档,以及如何在主控文档中管理子文档,相信大家学完,对主控文档与子文档这个功能将

java将office文档pdf文档转换成swf文件在线预览

java将office文档pdf文档转换成swf文件在线预览 第一步,安装openoffice.org   openoffice.org是一套sun的开源office办公套件,能在widows,linux,solaris等操作系统上执行. 主要模块有writer(文本文档),impress(演示文稿),Calc(电子表格),Draw(绘图),Math(公式),base(数据库) 笔者下载的是openoffice.org 3.3.0.下载完直接安装即可.      但是,我们还需要启动openof

创建MFC应用程序的类型:单文档+多文档+基于对话框

单文档支持文档视图架构,数据的保存--(读取--修改)文档类功能--显示(视图类功能),比较方便. 基于对话框,主窗口是对话框类型,可以方便的使用控件,所见即所得的编程,比较方便. 单文档类似"记事本"这样的应用程序,是文件处理软件的开发基础,只是每个应用程序仅处理一个文档(与多文档相比较). 基于对话框类似"计算器"这样的应用程序,没有需要处理的文档,一般是工具软件的开发基础. 基于对话框(3个类): CAboutDlg 程序名App 程序名Dlg 单文档(5个类

Android L / 5.0 帮助文档 API21文档 sample demo源码 下载

如无法登陆google,浏览android官网也是问题,这里提供android L的官方文档资料下载.API版本21 参考文档较大,解压后最好使用IE浏览器打开,并工具选项卡中设置为脱机工作模式, 如是,则打开文档速度会加快许多.否则发送js请求等待google响应,会出现加载十分缓慢的现象. 也可修改网页源码,使之不发送访问google的请求,请自行百度,etc 如果想用google搜索,又无法打开google网站,可以试用下谷粉搜索 http://www.gfsoso.com/ Androi

Elasticsearch-用于定义文档字段的核心类型-字符串类型

ES-用于定义文档字段的核心类型 ES中一个字段可以是核心类型之一,如字符串.数值.日期.布尔型,也可以是一个从核心类型派生的复杂类型,如数组. 字符串类型 索引一类型为字符串的数据doc1: FengZhendeMacBook-Pro:bin FengZhen$ curl -XPUT 'localhost:9200/music/album/2' -d '{ > "name":"Late Night with Elasticsearch", > &quo

48.输入任意正整数,编程判断该数是否为回文数(回文数是指从左到右读与从右到左读一样,如12321)

//1.输入一个数,将其每一位分离,并保存如一个数组 //2.判断数组最后录入的一位是第几位 //3.循环判断是否满足回问数的要求 #include<iostream> using namespace std; int main() { int n,temp; int k=0; int a[20]; cout<<"please input an number: "<<endl; cin>>n; for(int i=0;i<20;i+