lucene全文检索技术

 1:lucene的介绍

   全文检索引擎工具包。作用:使用lucene进行全文检索 。可以直接运行。 

   什么是全文检索。全文检索的场景,搜索引擎,搜索商品。

   站内搜索,只会搜索自己站内的资源

   全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索的文档的目的

   这种先建立索引,在对索引进行搜索的过程就叫全文检索。

   索引就类似于书籍的目录,目标文档就相当于书籍中的内容

   搜索书籍中的内容,如果不通过目录,很费劲

   其实,全文检索就是相当于给书籍编写目录。

 2:Lucene实现全文检索的流程

   

   采集数据---》创建索引----》用户查询---》搜索索引---》展示显示

    全文检索的流程:索引流程和搜索流程

 3:入门程序

  a :索引

  b :搜索

4:field域

 5:索引维护

 6:搜索

 7:相关度排序

 8:中文分词器

时间: 2024-10-05 23:56:42

lucene全文检索技术的相关文章

全文检索技术与Lucene的使用

概念 在谈全文检索之前,首先让我们来了解一下什么是信息检索.信息检索就是从信息集合中找出与用户需求相关的信息.被检索的信息除了文本外,还有图像.音频.视频等多媒体信息,这里我们只讨论文本信息的检索. 全文检索是信息检索技术的一种,主要是把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文本语义上的匹配.在信息检索工具中,全文检索是最具通用性和实用性的. 流程 建立索引 搜索的目的是为了在大量的信息中发现自己感兴趣的信息.但是,当有了足够的资料(比如网页.Word文档.Pdf文档,或数据

jQuery、HTML5、Spring Security安全权限、Lucene全文检索

获取[下载地址]   QQ: 313596790   [免费支持更新]支持三大数据库 mysql  oracle  sqlsever   更专业.更强悍.适合不同用户群体[新录针对本系统的视频教程,手把手教开发一个模块,快速掌握本系统]A 代码生成器(开发利器);      增删改查的处理类,service层,mybatis的xml,SQL( mysql   和oracle)脚本,   jsp页面 都生成   就不用写搬砖的代码了,生成的放到项目里,可以直接运行B 阿里巴巴数据库连接池druid

Spring MVC、Mybatis、Hibernate、Bootstrap、jQuery、HTML5、Spring Security安全权限、Lucene全文检索、Ehcache分布式缓存 、高性能、高并发【Java企业通用开发平台框架】

获取[下载地址]   QQ: 313596790   [免费支持更新] A 代码生成器(开发利器);    B 阿里巴巴数据库连接池druid;   数据库连接池  阿里巴巴的 druid.Druid在监控.可扩展性.稳定性和性能方面都有明显的优势 C 安全权限框架shiro ;  D ehcache 自定义二级缓存; E 微信接口开发(后续会加入Activiti5 工作流 )免费升级 -------------------------------------------------------

Lucene全文检索

 全文检索(Full-Text Retrieval)是指以文本作为检索对象,找出含有指定词汇的文本.全面.准确和快速是衡量全文检索系统的关键指标. l关于全文检索,我们要知道: 1,只处理文本. 2,不处理语义. 3,搜索时英文不区分大小写. 4,结果列表有相关度排序. l在信息检索工具中,全文检索是最具通用性和实用性的. Lucene全文检索

全文检索技术---Lucene

1       Lucene介绍 1.1   什么是Lucene Lucene是apache下的一个开源的全文检索引擎工具包.它为软件开发人员提供一个简单易用的工具包(类库),以方便的在目标系统中实现全文检索的功能. 1.2   全文检索的应用场景 1.2.1  搜索引擎 ©注意: Lucene和搜索引擎是不同的,Lucene是一套用java或其它语言写的全文检索的工具包.它为应用程序提供了很多个api接口去调用,可以简单理解为是一套实现全文检索的类库.搜索引擎是一个全文检索系统,它是一个单独运

Lucene全文检索入门体验

Lucene是Apache开源的全文检索框架, 是单纯的搜索工具, 简单易用. 现在已经出到5.2.1的版本, 只需在项目中导入必需的几个jar包就能使用. 使用的过程可以概括为, 1)  建立索引 2) 搜索查找, 获取搜索结果 这里我们一起先来学习几个会用到的核心类: Directory 该类在Lucene中用于描述索引存放的位置信息. 比如: Directory dir = FSDirectory.open(Paths.get("c:\\lucene\\index")); 其中&

Lucene全文检索基础

---------------------------------------------------------------------------------------------------------------[版权申明:本文系作者原创,转载请注明出处]文章出处:http://blog.csdn.net/sdksdk0/article/details/51873672作者:朱培     ID:sdksdk0 --------------------------------------

Lucene全文检索初识

Lucene 简述 Lucene是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎. 数据可以三种: 结构化数据(具有固定格式或有限长度的数据) 非结构化数据 半结构化数据 对于结构化数据一般使用SQL语句查询,而非结构化数据有顺序扫描和全文检索. Lucene 文件结构 层次结构:索引 -> 段 -> 文档 -> 域 -> 词 文档是Lucene索引和搜索的原子单位,文档为包括一个或多

Spring MVC、Mybatis、Hibernate、Bootstrap、HTML5、jQuery、Spring Security安全权限、Lucene全文检索、Ehcache分布式缓存 、高性能、高并发【Java企业通用开发平台框架】

功能特点: 1.适配所有设备(PC.平板.手机等),兼容所有浏览器(Chrome.Firefox.Opera.Safari.IE6~IE11等),适用所有项目(MIS管理信息系统.OA办公系统.ERP企业资源规划系统.CRM客户关系管理系统.网站.管理后台等). 2.快速开发,敏捷的数据持久层解决方案. 2.1.事务自动处理. 2.2.O/R Mapping基于注解,零配置XML,便于维护,学习成本低. 2.3.接口和实现分离,不需写数据持久层代码,只需写接口,自动生成添加.修改.删除.排序.分