全文搜索服务器solr

什么是solr?

solr是一个独立的企业级搜索应用服务器,本质是基于Lucene(一个开源的全文检索引擎工具包)的全文搜索服务器。

搜索引擎的原理是倒排索引。

倒排索引的原理,如何建立倒排索引表的。Lucene会先给所有的数据一个文档编号,将所有的内容进行分词操作,然后,将每个分词和对应的文档编号一起存储,最后将相同的分词合并,放入索引库中。当输入关键词进行搜索时,首先会对关键词也进行分词操作,然后将分词和索引库中的分词进行匹配,获取对应的文档编号,根据匹配度对文档进行排序显示。

为什么要使用solr?

原始查询方式一是速度慢,需要从第一个数据一个一个去匹配输入的关键词。二是容错低,当输入的关键词不准确时,就查不出来。当数据越多,访问量越大,查询效率就越低。这时,solr出现了,Solr采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化。solr还可以通过多样化查询方式来提高容错。

原文地址:https://www.cnblogs.com/w998/p/11624513.html

时间: 2024-08-30 05:08:49

全文搜索服务器solr的相关文章

linux集群系列(三):Solr全文搜索服务器部署(Solr-5.2.1)

Solr介绍 Solr作用 Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器.同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎. Solr下载 http://archive.apache.org/dist/lucene/solr/ Solr应用部署 部署准备: 1.      Linux系统已经安装了jdk和tomcat 2.      solr压缩

Apache Solr采用Java开发、基于Lucene的全文搜索服务器

http://docs.spring.io/spring-data/solr/ 首先介绍一下solr: Apache Solr (读音: SOLer) 是一个开源.高性能.采用Java开发.基于Lucene的全文搜索服务器,文档通过Http利用XML加到一个搜索集合中,查询该集合也是通过 http收到一个XML/JSON响应来实现.Solr 中存储的资源是以 Document 为对象进行存储的.每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性.Solr 中的每个 Doc

全文搜索技术——Solr

1.   学习计划 1. Solr的安装及配置 a)    Solr整合tomcat b)    Solr后台管理功能介绍 c)    配置中文分析器 2. 使用Solr的后台管理索引库 a)    添加文档 b)     删除文档 c)    修改文档 d)    查询文档 3. 使用SolrJ管理索引库 a)    添加文档 b)    修改文档 c)    删除文档 d)    查询文档 4. 电商搜索案例实现 a)    案例分析 b)    案例实现 2.   需求分析 使用Solr实

配置solr客户端(全文搜索服务器)

<properties> <solrj.version>4.10.3</solrj.version> </properties> <dependencyManagement> <dependencies> <!-- solr客户端 --> <dependency> <groupId>org.apache.solr</groupId> <artifactId>solr-solr

【java】企业级分布式搜索平台Solr视频教程

课程背景为了满足高可用.可扩展并容错的分布式搜索引擎.Solr是一个高性能,采用Java5开发, 基于Lucene的全文搜索服务器.同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎 教程目录:课时1:课程介绍课时3:1.搜索引擎及solr概述课时4:3.solr基于tomcat下安装课时5:2.solr基于jetty部署及安装课时6:4.solr管理控制台课时7:5.sche

搜索技术---solr

solr 企业站内搜索技术选型 在一些大型门户网站.电子商务网站等都需要站内搜索功能,使用传统的数据库查询方式实现搜索无法满足一些高级的搜索需求,比如:搜索速度要快.搜索结果按相关度排序.搜索内容格式不固定等,这里就需要使用全文检索技术实现搜索功能. 单独使用Lucene实现 单独使用Lucene实现站内搜索需要开发的工作量较大,主要表现在:索引维护.索引性能优化.搜索性能优化等,因此不建议采用. 使用Google或Baidu接口  通过第三方搜索引擎提供的接口实现站内搜索,这样和第三方引擎系统

企业级搜索应用服务器solr介绍

简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引:也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果: 特点 Solr是一个独立的企业搜索服务器REST-like API. 你把文件(称为"索引") 通过XML.JSON.CSV通过HTTP或二进制. 你查询它通过HTTP GET和接收XML.JSON.CSV或二进制的结果. 高级全文搜索功

带 IK 分词器的 Luke 和 搜索应用服务器solr

首先在网上查了一下: Solr Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口.用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果. Solr引擎 Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器.同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展并对查询性能进行了优化,并且提供了一个完善的功能

ftserver 使用,全文搜索,可搜古文古诗词

ftserver是一个全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,轻松处理古文古诗词,写意句子不影响搜索,不依赖词库,搜索中文不漏词.比同类产品更容易理解与按需定制,并且直接编译就可以使用,无需额外配置,同时可以嵌入到各种应用内部.支持 English, 简体中文, 正體中文, 日本語, ???, Русский, Deutsch ...,支持多语言混合搜索. 安装: 1. C#版本直接下载,放入一个支持asp.net的服务器中就可