lucene和egg项目的异同点

1 和lucene一样 支持全域索引

2 对字符串域提供全文检索,对数字类型域提供范围查询

3 采取和lucene类似的倒排表压缩方式

4 和lucene的多级跳转表不同,egg采取的是B+树做索引,这种数据结构在应付大数量的存储上面更加适合。

5 和lucene不一样, egg不仅仅是个全文检索引擎包,采用C/S架构进行数据访问,并且制定了一套类似于sql的数据操作语法

6 可采用类似于mysql的binlog方式对数据进行主从备份

7 支持sharding的数据分布式存储方式

8 C语言实现,良好的平台移植性。

9 对不同的域能采用不用的切词方式,lucene只能用一种切词方式

参数指标

索引压缩高效,索引大小和实际数据大小比率1:1

索引创建速度快,50W条数据建立索引只需要25S

查询速度快,在50W数据总量的条件下,查询时间在0.2S以下

时间: 2024-08-29 15:48:08

lucene和egg项目的异同点的相关文章

关于EGG项目添加Joi参数校验解决方案

使用Joi来对egg项目进行参数校验 Joi是什么 Joi?是 hapijs 自带的数据校验模块,高度封装常用的参数校验功能.?Joi文档 项目中引入Joi 将Joi挂载在app对象下,? app.js const Joi = require('@hapi/joi'); const path = require('path'); class AppBootHook { constructor(app) { this.app = app; const directory = path.join(a

Web 应用程序项目与 Visual Studio 中的网站项目的异同

要查看英语原文,请勾选“英语”复选框.也可将鼠标指针移到文本上,在弹出窗口中显示英语原文. 翻译 英语 本文档已存档,并且将不进行维护. Web 应用程序项目与 Visual Studio 中的网站项目 在Visual Studio可以创建 Web 应用程序项目 或 网站项目. 通过选择 新建项目 或 打开项目 创建或打开一个 Web 应用程序项目在Visual Studio 文件 菜单. 通过选择 新建网站 或 打开网站 创建或打开一个网站项目在"文件"菜单. 每种项目类型各有优缺点

Lucene:基于Java的全文检索引擎简介 (zhuan)

http://www.chedong.com/tech/lucene.html ********************************************** Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具体的安装和使用简介:系统结构介绍和演示 Hacking Lucene:简化的查询分析器,删除的

C#开源资源项目

一.AOP框架 Encase 是C#编写开发的为.NET平台提供的AOP框架.Encase 独特的提供了把方面(aspects)部署到运行时代码,而其它AOP框架依赖配置文件的方式.这种部署方面(aspects)的方法帮助缺少经验的开发人员提高开发效率. NKalore是一款编程语言,它扩展了C#允许在.net平台使用AOP.NKalore的语法简单.直观,它的编译器是基于Mono C#编译器(MCS).NKalore目前只能在命令行或#Develop内部使用.NKalore兼容公共语言规范CL

Lucene:基于Java的全文检索引擎简介

Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具体的安装和使用简介:系统结构介绍和演示 Hacking Lucene:简化的查询分析器,删除的实现,定制的排序,应用接口的扩展 从Lucene我们还可以学到什么 另外,如果是在选择全文引擎,现在也许是试试 Sphinx的时候了:相比Lucene速度更快, 有中文分词的

程序员必备,C#各类项目、开源项目插件资料收藏

一.AOP框架 Encase 是C#编写开发的为.NET平台提供的AOP框架.Encase独特的提供了把方面(aspects)部署到运行时代码,而其它AOP框架依赖配置文件的方式.这种部署方面(aspects)的方法帮助缺少经验的开发人员提高开发效率. NKalore是一款编程语言,它扩展了C#允许在.net平台使用AOP.NKalore的语法简单.直观,它的编译器是基于Mono C#编译器(MCS).NKalore目前只能在命令行或#Develop内部使用.NKalore兼容公共语言规范CLS

1.Lucene简介

1.Lucene简介 Lucene是一个基于Java的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能 Lucene是开源项目.它是可扩展的,高性能的库用于索引和搜索几乎任何类型的文本, Lucene库提供了所需的任何搜索应用程序的核心业务.索引和搜索 实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,告诉你你要搜索的关键词出现在哪里 2.Lucene的特点 倒排索引  压缩算法  二元搜索 1.1.倒排索引 :

egg 自学入门demo分享

目录 安装 项目 连接数据库 编写model 编写controller 添加路由 2018-08,本文适用于对egg有兴趣想要了解的同学 完整项目代码:https://github.com/NameHewei/node-egg 项目主要文件目录结构 |-- app |-- controller |-- cook.js |-- model |-- cook.js |-- router.js |-- config |-- config.default.js |-- plugin.js |-- pac

Egg中使用egg-mongoose和常用的Mongoose 方法

Mongoose Mongoose就是一套操作MongoDB数据库的接口,而Egg中有对应的插件egg-mongoose. 安装 $ npm install egg-mongoose --save 配置 改变Egg项目中的配置文件{workplace}/config/plugin.js中来启用 egg-mongoose 插件: exports.mongoose = { enable: true, package: 'egg-mongoose', }; Egg连接mongoose 在Egg项目中的