lucene 排序

（1）排序对一个文档里什么域都没存储，使用字符串排序会排在首位
（2）排序对一个文档里什么域都没存储，使用数字类型排序会默认给其赋值为0进行排序
（3）我们可以对数字类型的null值的文档进行代码控制，可以将其设置为最大，所以将会排在最后面，代码如下

SortField sortField = new SortField("value", SortField.Type.INT);
sortField.setMissingValue(Integer.MAX_VALUE);

filedType

< fieldType name =" string " class =" solr.StrField " sortMissingLast =" true " omitNorms =" true " />

name：标识而已。
class和其他属性决定了这个fieldType的实际行为。（class以solr开始的，都是在org.appache.solr.analysis包下）
可选的属性：

sortMissingLast和sortMissingFirst两个属性是用在可以内在使用String排序的类型上（包括：string,boolean,sint,slong,sfloat,sdouble,pdate）。
sortMissingLast="true"，没有该field的数据排在有该field的数据之后，而不管请求时的排序规则。
sortMissingFirst="true"，跟上面倒过来呗。
2个值默认是设置成false

http://my.oschina.net/MrMichael/blog/220773

http://www.blogjava.net/conans/articles/379545.html

时间： 2024-08-08 04:36:45

lucene 排序的相关文章

原创:史上对BM25模型最全面最深刻的解读以及lucene排序深入讲解(佟学强)

垂直搜索结果的优化包括对搜索结果的控制和排序优化两方面,其中排序又是重中之重.本文将全面深入探讨垂直搜索的排序模型的演化过程,最后推导出BM25模型的排序.然后将演示如何修改lucene的排序源代码,下一篇将深入解读目前比较火热的机器学习排序在垂直搜索中的应用.文章的结构如下: 一.VSM模型简单介绍: 二.lucene默认的评分公式介绍: 三.概率语言模型中的二元独立模型BIM介绍: 四.BM25介绍: 五.lucene中的edismax解析器介绍以及评分公式源代码介绍: 六.修改排序源代码:

lucene查询排序结果原理总结

参考文章 Lucene3.0结果排序原理+操作+示例 Lucene的排序算法一句话总结lucene排序算法是什么样的关键几个概念参考文档: http://lucene.apache.org/core/4_10_3/core/org/apache/lucene/search/similarities/TFIDFSimilarity.html tf idf http://blog.csdn.net/duck_genuine/article/details/6394701

基于spark排序的一种更廉价的实现方案-附基于spark的性能测试

排序可以说是很多日志系统的硬指标(如按照时间逆序排序),如果一个大数据系统不能进行排序,基本上是这个系统属于不可用状态,排序算得上是大数据系统的一个"刚需",无论大数据采用的是hadoop,还是spark,还是impala,hive,总之排序是必不可少的,排序的性能测试也是必不可少的. 有着计算奥运会之称的Sort Benchmark全球排序每年都会举行一次,每年巨头都会在排序上进行巨大的投入,可见排序速度的高低有多么重要!但是对于大多数企业来说,动辄上亿的硬件投入,实在划不来.甚至远

Lucene 3.0 输出相似度

http://www.cnblogs.com/ibook360/archive/2011/10/19/2217638.html Lucene3.0之结果排序(原理篇) 传统上,人们将信息检索系统返回结果的排序称为"相关排序" (relevance ranking) ,隐含其中各条目的顺序反映结果和查询的相关程度. 1. 基本排序原理 ① 向量空间模型 Gerald Salton 等在 30 多年前提出的"向量空间模型" (Vector Space Model

一步一步跟我学习lucene（13）---lucene搜索之自定义排序的实现原理和编写自己的自定义排序工具

自定义排序说明我们在做lucene搜索的时候,可能会需要排序功能,虽然lucene内置了多种类型的排序,但是如果在需要先进行某些值的运算然后在排序的时候就有点显得无能为力了: 要做自定义查询,我们就要研究lucene已经实现的排序功能,lucene的所有排序都是要继承FieldComparator,然后重写内部实现,这里以IntComparator为例子来查看其实现: IntComparator相关实现其类的声明为 public static class IntComparator exte

Lucene 时间排序

在Lucene4.4中,想要实现搜索结果按照时间倒序的效果:如果两个文档得分相同,那么就按照发布时间倒序排列:否则就按照分数排列.这种效果在Lucene4.6中实现起来极其简单,直接利用search接口的Sort参数即可达成,完全不需要像某些人说的重写Similarity那么麻烦.三两行代码的事情,体现了Make it simple, stupid的精髓. 首先来看看测试例子,这个例子中我建立了四个文档,按照内容-发布日期来表示分别是: 2004年光棍节攻略 , 20041111 2005年光棍

Lucene - CustomScoreQuery 自定义排序

在某些场景需要做自定义排序(非单值字段排序.非文本相关度排序),除了自己重写collect.weight,可以借助CustomScoreQuery. 场景:根据tag字段中标签的数量进行排序(tag字段中,标签的数量越多得分越高) public class CustomScoreTest { public static void main(String[] args) throws IOException { Directory dir = new RAMDirectory(); Analyze

lucene之排序、设置权重、优化、分布式搜索(转)

lucene之排序.设置权重.优化.分布式搜索(转) 1. 基本应用 using System;using System.Collections.Generic;using System.Text;using Lucene.Net;using Lucene.Net.Analysis;using Lucene.Net.Analysis.Standard;using Lucene.Net.Documents;using Lucene.Net.Index;using Lucene.Net.QueryP

lucene 自定义评分影响排序

前记这段时间需要修改一个别人写的一个搜索有关的项目,恰好底层使用的是lucene搜索框架. 为什么要去修改呢,当然是搜索结果不太令人满意啦,于是去研读了项目中关于搜索的代码...... 正文经过了几天代码的研读,最终总结出来了几条问题: 创建索引的过程,相当简单,感觉仅仅是把lucene当成关键词匹配的工具去了(需要修改索引策略) 搜索的过程也是比较简单,没有结合项目的需求,定制化搜索(搜索策略需要修改) 额,感觉上面两条好像是在说废话,感觉lucene的和核心就是索引和搜索为了能尽快解决

猜你喜欢

墙壁网线插座风波

事发起因:早上王总说电脑上不起网,下去发现本地连接断开,重插依旧如此.询问得知,是王总移动电脑后本地连接就一直断开.因公司布线结构是公司下面电脑网线直通机房交换机.第一判断是交换机那头出问题 ...

简易的C/S系统(实现两个数的和)

//Client:#include <string.h> #include <sys/socket.h> #include <stdio.h> #include & ...

Greenplum+Hadoop学习笔记-14-定义数据库对象之创建与管理表

6.4.创建与管理表 6.4.1.创建表通过查询CREATETABLE命令帮助如下所示: Command: CREATE TABLE Description: define a new ta ...

手机APP创建桌面快捷方式

预览: 需要权限: 1 <uses-permission android:name="com.android.launcher.permission.INSTALL_SHORTCUT ...

C# WinForm 为 RichTextBox 添加行号小技巧

在代码显示的时候,有行号会非常的方便舒服(可能是个人习惯). 这让我想到博客园的代码显示,添加行号居然是在每一行代码前添加数字,只能说是下下策,身为处女座的我对此很是不满,虽然曾经也这样想过.. 测试 ...

5.13 有关游戏设计的总结

一.设置eclipse游戏开发的JRE windows---preference---Install JREs---jdk---edit--- -Xmx128m 二.统一建模语言UML(Unifie ...

第40课前置操作符和后置操作符

1. ++i和i++真的有区别吗? (1)现代编译器会对代码进行优化.对于基础类型,前置++和后置++的汇编代码几乎是一样的,最终效率完全一样. (2)优化使得最终的二进制程序更加高效 (3)优化后的 ...

LVS类型的介绍，调度算法和不同类型的实现

LVS类型介绍,调度算法和不同类型的实现 LVS集群的组成与特点 Linux虚拟服务器(Linux Virtual Server,LVS),是一个由章文嵩开发的一款自由软件.利用LVS可以实现高可用的 ...

leetcode数据库sql之Delete Duplicate Emails

leetcode原文引用: Write a SQL query to delete all duplicate email entries in a table named Person, keepi ...

算法笔记_042:求最小公倍数（Java）

目录 1 问题描述 2 解决方案 1 问题描述何为最小公倍数?能同时被数字m和数字n整除的最小整数.例如,24和60的最小公倍数等于120.下面请编写相关函数实现求取数字m和n的最小公倍数. 2 ...

赵杖渍克口kr5a9bhr17y6a8

新华社瓦莱塔4月10日电(记者李拯宇李佳)全国政协主席俞正声10日在前往非洲三国进行正式友好访问途中过境马耳他,在瓦莱塔会见马耳他议长法鲁贾. 俞正声说,中马保持长期友好关系,政治上相互信任,经济上 ...

Ext JS表单Ext.form.FormPanel

1.表单对于传统的b/s应用来说,数据录入元素是放在表单<form>标签里面的.而对于ExtJS应用来说,则可以直接使用FormPanel控件来存放表单中的元素.FormPanel继承自 ...

从Object.definedProperty中看双向数据的绑定

前言 Object.defineProperty是ES5中的方法,vue.js正式利用这种方法实现数据的双向绑定,以达到响应式的目的. 1.语法 Object.defineProperty(objec ...

基于shell脚本比较数字加减乘除

让用户输入两个数来比较他们的大小先用touch命令新建一个2.sh文件在用vi进入i进入编辑状态输入保存后检查

[Linked List]Delete Node in a Linked List

otal Accepted: 48115 Total Submissions: 109291 Difficulty: Easy Write a function to delete a node (e ...

HTTP原理简单介绍

嗯, cao,卡顿5s,上次计划撸代码来着,后来感觉不很现实?又着实low比~就打算把笔记搞上一搞~然,今天起个大啊早,又来变卦.哈哈哈~人生处处不惊喜~嘻嘻嘻来开始你的表演~ <HTTP原 ...

angularjs2 一些报错的概览（数据为json格式）

{"Unterminated string literal.": "未终止的字符串文本.","Identifier expected.": ...

山西宗教文化漫谈（一）

宗教伴随着三晋文化的兴起而兴起,伴随着三晋文化的发展而发展.山西人在一块山河阻隔的天地里,一方面塑造了自己的神,同时也不断地被输入外来神,并把他们山西化.佛门在山西特别火热.道教作为中国本土的宗教教派 ...

maven实战第九篇_09_yucong_背景开发案例：注册用户

1 注册用户用例主要场景 1 用户访问注册页面 2 系统生成验证码图片 3 用户输入想要的ID,Emial地址,想要的显示名称,密码,确认密码 4 用户输入验证码 5 用户提交注册请求 6 系统检查 ...

向MapReduce转换：生成用户向量

分两部分: <span style="font-size:18px;">/*** * @author YangXin * @date 2016/2/21 * @ inf ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.