Lucene是如何理解文档的 & 文档类型（Types）是如何被实现的

Lucene是如何理解文档的

在Lucene中，一份文档（Document）由一系列简单的字段-值（field-value）对组成。一个字段必须有值，同时允许包含多值。同样的，一个单一的字符串在分析处理过程中可能被转换成多个值。Lucene不关心值到底是字符串、数字还是日期——所有的值都以不可理解的比特值（opaque）对待。

当我们在Lucene中索引一份文档时，值和字段在反向索引（inverted index）中被关联起来。可选项的是，是否将原始值存储起来以便今后使用，存储后的值是不可更改的。

文档类型（Types）是如何被实现的

Elasticsearch的类型实现在简单的基础设施之上。一个索引可能存在多种类型，每种类型都有自己的mapping（类型数据库的schema）。同时同一类型下的每份文档都被存储在相同的索引里。

由于Lucene没有文档类型的概念，文档的类型名被存储在文档的一个被称为_type的元数据中。当我们在搜索某种类型的文档，Elasticsearch只是简单地使用该类型的值在_type字段上进行过滤。

Lucene也没有mapping的概念。Mapping是Elasticsearch的一个层，将复杂的JSON文档映射到Lucene能处理的简单的扁平的文档。

Lucene是如何理解文档的 & 文档类型（Types）是如何被实现的

时间： 2024-11-07 08:20:49

Lucene是如何理解文档的 & 文档类型（Types）是如何被实现的的相关文章

如何快速阅读并理解英文的技术文档

作为一名程序员,要实现我们的产品,首先需要选择一种或几种编程语言,其次是使用各种工具和第三方库. 而在这个过程中,就少不了对这些语言.工具和第三方库的下载和学习. 下载一般都非常简单,但是关于如何使用,相信大家都会有各种各样的学习方法. 但是不管通过什么方式,追根溯源都会来到官方文档. 那么问题就来了!目前来说,大部分的官方文档都是英文的,如何才能快速的理解并使用官方文档呢? 今天,把自己的学习方法拿出来,和大家一起分享一下,希望大家可以尽量少走一些弯路,尽快的找到bug的解决方法. 说起来很简

仿百度文库、豆丁文档在线文档带全套工具

这个是非常棒的一套在线文档分享系统源码,仿百度文库.豆丁文档网站源码,在这里完全免费提供给大家学习.在这里无需任何币就可以下载到非常多的精品源码,如果觉得好站长资源做的不错,请帮忙推荐给更多的站长朋友,并且里面还有一个设置说明图. 此套源码非常干净的,不像现在很多所谓VIP源码论坛放大量的垃圾广告文件在里面,更没有在里面加入垃圾加密广告代码. 安装以下软件前,先要在本机装好OFFICE2007 net2.0以上 windows2003 系统退掉杀毒软件切忌! 1:安装

稻米文档助手——文档库01

稻米文档助手——文档库01已经提供下载了. 主要收集的是C++/Win32/MFC方面的资料. 文档库下载地址:Part1: http://download.csdn.net/detail/lifeandc/8421437 Part2: http://download.csdn.net/detail/lifeandc/8421451 下载解压后,通过选择开始-->文档库页面的添加命令,添加文档库即可使用.

Word 主控文档与子文档（免费课程资料）

课程简介:Word中的主控文档与子文档这个功能,对于大部分人来说,应该是不太了解的,不了解就更谈不上应用了.这也是制作这个视频课程的目的,希望更多的人能够了解并在需要时能真正应用到工作中.那在什么时候能用到这个功能呢?当有一个大文档需要拆分成多个小文档分工合作时:当你正在写一本书或写一篇论文想一章保存为一个文档,最后再把所有的小文档合并成一个大文档来组织管理时,这个功能就非常有意义了.这个视频课程主要讲了如何创建主控文档,以及如何在主控文档中管理子文档,相信大家学完,对主控文档与子文档这个功能将

java将office文档pdf文档转换成swf文件在线预览

java将office文档pdf文档转换成swf文件在线预览第一步,安装openoffice.org openoffice.org是一套sun的开源office办公套件,能在widows,linux,solaris等操作系统上执行. 主要模块有writer(文本文档),impress(演示文稿),Calc(电子表格),Draw(绘图),Math(公式),base(数据库) 笔者下载的是openoffice.org 3.3.0.下载完直接安装即可. 但是,我们还需要启动openof

创建MFC应用程序的类型：单文档+多文档+基于对话框

单文档支持文档视图架构,数据的保存--(读取--修改)文档类功能--显示(视图类功能),比较方便. 基于对话框,主窗口是对话框类型,可以方便的使用控件,所见即所得的编程,比较方便. 单文档类似"记事本"这样的应用程序,是文件处理软件的开发基础,只是每个应用程序仅处理一个文档(与多文档相比较). 基于对话框类似"计算器"这样的应用程序,没有需要处理的文档,一般是工具软件的开发基础. 基于对话框(3个类): CAboutDlg 程序名App 程序名Dlg 单文档(5个类

Android L / 5.0 帮助文档 API21文档 sample demo源码下载

如无法登陆google,浏览android官网也是问题,这里提供android L的官方文档资料下载.API版本21 参考文档较大,解压后最好使用IE浏览器打开,并工具选项卡中设置为脱机工作模式, 如是,则打开文档速度会加快许多.否则发送js请求等待google响应,会出现加载十分缓慢的现象. 也可修改网页源码,使之不发送访问google的请求,请自行百度,etc 如果想用google搜索,又无法打开google网站,可以试用下谷粉搜索 http://www.gfsoso.com/ Androi

Elasticsearch-用于定义文档字段的核心类型-字符串类型

ES-用于定义文档字段的核心类型 ES中一个字段可以是核心类型之一,如字符串.数值.日期.布尔型,也可以是一个从核心类型派生的复杂类型,如数组. 字符串类型索引一类型为字符串的数据doc1: FengZhendeMacBook-Pro:bin FengZhen$ curl -XPUT 'localhost:9200/music/album/2' -d '{ > "name":"Late Night with Elasticsearch", > &quo

48.输入任意正整数，编程判断该数是否为回文数(回文数是指从左到右读与从右到左读一样，如12321）

//1.输入一个数,将其每一位分离,并保存如一个数组 //2.判断数组最后录入的一位是第几位 //3.循环判断是否满足回问数的要求 #include<iostream> using namespace std; int main() { int n,temp; int k=0; int a[20]; cout<<"please input an number: "<<endl; cin>>n; for(int i=0;i<20;i+

猜你喜欢

权限管理

权限管理,一般指根据系统设置的安全规则或者安全策略,用户可以访问而且只能访问自己被授权的资源,我们所做就是为了实现这一功能. 1.main.php页面: 通过ajax可以在当前页面实现对用户的管理权限 ...

java使用freemarker生成word文档

1.原料开源jar包freemarker.eclipse.一份模板word文档 2.首先设计模板word文档一般,通过程序输出的word文档的格式是固定的,例如建立一个表格,将表格的标题写好,表格 ...

Cordova Android源码分析系列一（项目总览和CordovaActivity分析）

PhoneGap/Cordova是一个专业的移动应用开发框架,是一个全面的WEB APP开发的框架,提供了以WEB形式来访问终端设备的API的功能.这对于采用WEB APP进行开发者来说是个福音,这可 ...

python paramiko模块的使

一般使用paramiko的功能就是通过ssh远程执行命令,远程(上传.下载)传输文件等等依赖包:/usr/local/python27/bin/pip install pycrypto 下载包 pa ...

操作系统---Systemd

Systemd 概述: CentOS 6和之前版本采用SysVinit的系统启动进程管理体系,一般用户都可通过在/etc/inittab文件的配置,来个性化自己的系统启动序列.但也经常会由于特殊环境的 ...

[Javascript] Advanced Reduce: Composing Functions with Reduce

Learn how to use array reduction to create functional pipelines by composing arrays of functions. co ...

python基础教程：第一章

引言 Python是一门计算机能够理解的语言.功能强大,容易入门.是初学者学习编程语言不错的选择.本篇属于python基础知识.简单介绍了变量.函数.模块和字符串的知识. 内容主要介绍变量.语句.函 ...

Zorka监控平台的Online reconfiguration基本效果展示

在上一篇日志中,我简单介绍了Zorka的Online reconfiguration的使用方法,但是没怎么介绍怎样看到在线更改的效果,这里简单说说. 还是以之前的tomcat为例,我们在目录zorka ...

精简Linux文件路径

精简Linux的文件路径: ..回退的功能 .留在当前目录 //只保留一个/ abc/..要返回. 报错删除最后一个/ 主要思路: 用栈记录路径的起始位置,讨论/后的不同情况即可: #include ...

UIApplicationShortcutIconType

UIApplicationShortcutIconTypeCompose UIApplicationShortcutIconTypePlay UIApplicationShortcutIconType ...

面向接口设计和编程——（面向对象、面向接口、面向过程、面向实现） --转载

引言--面向接口所处的设计模式中的位置. 其实,我认为Java/C#比C++高级的其中一个原因是,它对面向接口编程的支持.不要误解,并不是说C++不支持面向接口编程,而是说C++的语法中没有这种天然的 ...

OpenGL基础渲染

OpenGL渲染管线(简化版) 客户端-服务器客户端是存储在CPU存储器中的,并且在应用程序中执行(或者驱动程序),驱动程序将渲染命令和数据组合起来,发动到服务器执行.服务器和客户机在功能上市异步的 ...

zookeeper的安装和配置

1.将zookeeper-3.4.5.tar.gz这个文件上传到huanghe的/usr/local目录下 2.进入local目录下,执行解压 tar -zxvf zookeeper-3. ...

UML中的四种关系

一.Association关联关系说明:Assocition(关联):描述了两个或多个类之间的结构性关系. (1)普通关联: 1)Association name名称:用以描述该关系的性质. 2)R ...

【转】Windows 邮件槽(MailSlot)

Windows 邮件槽(MailSlot) 来自<Windows网络编程第二版中文版> 优点:通过网络,将一条消息广播给一台或多台计算机. 缺点:只允许从客户机到服务器,建立一种不可靠的 ...

绘制方框云线标注

(defun c:tt2 () ( (progn (command "_rectang" pause pause) ;绘制长方形 (setq en1 (entlast)) ;选择刚 ...

python 脚本函数传递参数

比如这段代码:def add(num): num= num+10d=2add(d)print d 输出 2如果我要像C那样传递d的地址,使之输出12,我应该怎么做? Python的函数传递方式是赋值 ...

ThinkPHP学习-2：模块化设计

1. 前台后台统一目录管理将后台管理界面Admin放入myWeb目录下,实现前台和后台放在同一目录,便于管理和维护. 具体步骤: 1. 将/myWeb/Home目录复制粘贴为/Admin目录: 2. ...

canvas 绘制五角星

<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...

如风一样，飞翔------Day37

我一直都认为自己是个反应没有那么敏锐的人,而不幸的是事实上也是,所以,在菜鸟的头衔上,我不得不再背负上一个笨鸟的"光芒",我不苛求一飞冲天的传奇,却也有着不甘寂寞的激昂,我选择先飞 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.