Solr聚合查询

1 分组查询

概述：Solr常用的分组查询有两种，Facet分组和Group分组，分别以下列出这两种查询：

1.1 Facet分组

solr种以导航为目的的查询结果成为facet，在用户查询的结果上根据分类增加了count信息，然后用户根据count信息做进一步搜索,

Facet是solr的高级搜索功能之一,可以给用户提供更友好的搜索体验.在搜索关键字的同时,能够按照Facet的字段进行分组并统计。

Solr Fact提供了4种类型的Fact

<lstname="facet_counts">
<lstname="facet_queries"/>
<lstname="facet_fields"/>
<lstname="facet_dates"/>
<lstname="facet_ranges"/>
</lst>
facet_queries:代表自定义条件查询facet，类似数据库的count函数
facet_fields ：代表根据字段分组查询，类似数据库的groupby count的组合
facet_dates：根据日期区间分组查询
facet_ranges：当然了，日期有区间，数字也有，这个就是根据数字分组查询

说明：

facet的基本功能就是对搜索结果中的数据进行分类。

facet用法

facet.field:指定要分类的字段
facet=on 或 facet=true表示功能开启
facet.prefix 表示字段前缀
facet.limit 表示返回的记录数
facet.offict 表示从第几条开始，主要用于分页
facet.query可以任意定义查询

Range Facet

一般用于date类型或数字类型的字段。

&facet=on
&facet.query=date:[2009-1-1T0:0:0ZTO 2010-1-1T0:0:0Z]

参数说明

facet.range 需要做facet查询的字段
facet.range.start 设置起始点
facet.range.end 设置终止点
facet.range.gap 限定每一段范围的区间差值
facet.range.hardend 指定如何处理最后一个区间
facet.range.include 指定如何处理临界值
facet.range.other 指定如何处理限定范围以为的结果
facet.range.method 指定facet算法

如下查询：

http://localhost:8983/solr/solr_select/query?q=*:*&facet=on&facet.field=name

根据name字段分组查询结果

1.2 Group分组

Solr对结果的分组处理除了facet还可以使用group。Solr的group是根据某一字段对结果分组，将每一组内满足查询的结果按顺序返回。

Group对比Facet

Group和Facet的概念很像，都是用来分组。Facet返回所有相关的结果并允许用户基于facet的目录重新定义结果集。Facet可以对分组数量进行过滤，以及排序，和日期范围，时间范围分组，但是如果你想得到具体的数据，还得需要查询一次或多次。group可以得到分组的组数量，一次请求，可以拿到所有的数据。

Group和Facet可以结合起来使用，但只能使用facet.field和facet.range，还不支持日期date和维度统计pivot faceting.

如下查询：

http://localhost:8983/solr/solr_select/query?q=*:*&group=true&group.field=name

参数说明：

参数	类型	说明
group	布尔值	设为true，表示结果需要分组
group.field	字符串	需要分组的字段，字段类型需要时是StrField或TextField
group.func	查询语句	可以指定查询函数
group.query	查询语句	可以指定查询语句
rows	整数	返回多少组结果，默认10
start	整数	指定结果开始位置/偏移量
group.limit	整数	每组返回多数条结果,默认1
group.offset	整数	指定每组结果开始位置/偏移量
sort	排序算法	控制各个组的返回顺序
group.sort	排序算法	控制每一分组内部的顺序
group.format	grouped/simple	设置为simple可以使得结果以单一列表形式返回
group.main	布尔值	设为true时，结果将主要由第一个字段的分组命令决定
group.ngroups	布尔值	设为true时，Solr将返回分组数量，默认fasle
group.truncate	布尔值	设为true时，facet数量将基于group分组中匹相关性高的文档，默认fasle
group.cache.percent	整数0-100	设为大于0时，表示缓存结果，默认为0。该项对于布尔查询，通配符查询，模糊查询有改善，却会减慢普通词查询。

2 Stats Component聚合查询

摘要: Solr可以利用StatsComponent实现对数字、字符串或日期字段的聚合统计查询，即：min、max、avg、count、sum的功能

Stats Component参数说明：

参数	描述
stats	布尔值，设为true，表示开启Stats Component
stats.field	指定需要做统计的字段
stats.facet	对指定的facet生成一个子结果集
stats.calcdistinct	布尔值，将会返回”countDistinct”和”distinctValues”，其代价很高。默认fasle

stats Component统计内容

统计项目	描述	支持的类型	是否默认输出
min	最小值	所有	是
max	最大值	所有	是
sum	和	数字、日期	是
count	个数	所有	是
missing	空值的个数	所有	是
sumOfSquares	平方和	数字、日期	是
mean	均值数字、日期	是
stddev	标准差	数字、日期	是
percentiles	精度/小数点后几位	数字	否
distinctValues	set/不重复值集合	所有	否
countDistinct	set精确个数/不重复值集合大小，使用代价很大	所有	否
cardinality	set个数/不重复值集合大小，可能不准确	所有	否

如下查询：

http://localhost:8983/solr/solr_select/select?q=*:*&stats=true&stats.field=id&rows=0&indent=true

原文地址：https://www.cnblogs.com/cuihongyu3503319/p/9337515.html

时间： 2024-11-05 21:40:53

Solr聚合查询的相关文章

python操作mongodb之二聚合查询

#聚合查询 from pymongo import MongoClient db = MongoClient('mongodb://10.0.0.9:27017/').aggregation_example #准备数据 result = db.things.insert_many([{"x": 1, "tags": ["dog", "cat"]}, {"x": 2, "tags": [&

/* 创建者:菜刀居士的博客 * 创建日期:2014年07月08号 */ namespace Net.CRM.FetchXml { using System; using Microsoft.Xrm.Sdk; using Microsoft.Xrm.Sdk.Query; /// <summary> /// 使用FetchXml聚合查询 /// </summary> public class FetchXmlDemo { /* 特别提示:FetchXML 包括使您能够计算总和.平均值

crm使用FetchXml分组聚合查询

/* 创建者:菜刀居士的博客 * 创建日期:2014年07月09号 */ namespace Net.CRM.FetchXml { using System; using Microsoft.Xrm.Sdk; using Microsoft.Xrm.Sdk.Query; /// <summary> /// 使用FetchXml聚合查询,分组依据 /// </summary> public class FetchXmlExtension { /// <summary> /

MongoDB的使用学习之（七）MongoDB的聚合查询（两种方式）附项目源码

先来张在路上-- 此项目是用Maven创建的,没有使用Maven的,自己百度.谷歌去:直接用Junit测试就行,先执行里面的save方法,添加10000条测试数据提供各种聚合查询等. 废话不多说,上干货-- 一.MongoDB数据库的配置(mongodb.xml) 以下是我自己的配置,红色字体请改为自己本机的东东,你说不懂设置端口,不会创建数据库名称,不会配置用户名密码,那有请查阅本系列的第4节(MongoDB的使用学习之(四)权限设置--用户名.密码.端口==),你说懒得设置,那就@#￥%--

Elasticsearch5.0 Java Api(七) -- 聚合查询

测试聚合查询功能 1 package com.juyun.test; 2 3 import java.net.InetAddress; 4 import java.util.List; 5 6 import org.elasticsearch.action.search.SearchResponse; 7 import org.elasticsearch.client.Client; 8 import org.elasticsearch.common.settings.Settings; 9 i

Dynamics CRM 2015/2016 Web API：聚合查询

各位小伙伴们,今天是博主2016年发的第一篇文章,首先祝大家新年快乐,工资Double,哈哈.今天我们来看一个比较重要的Feature--使用Web API执行FetchXML查询!对的,各位,你们没有听错,使用Web API执行FetchXML查询.在过去我们做这样的事情可是要花九牛二虎之力哟,拼接大量的SOAP消息体而且还容易出错.现在好了,我们自己可以在URL里面加上我们想要执行的FetchXML即可,系统则会乖乖的把我们想要的数据返回回来,是不是很美好呢! 言归正传,Web API的数据

Django Aggregation数据库聚合查询

在当今根据需求而不断调整而成的应用程序中,通常不仅需要能依常规的字段,如字母顺序或创建日期,来对项目进行排序,还需要按其他某种动态数据对项目进行排序.Djngo聚合就能满足这些要求. 以下面的Model为例 from django.db import models class Author(models.Model): name = models.CharField(max_length=100) age = models.IntegerField() class Publisher(model

如何大幅优化solr的查询性能(转)

提升软件性能,通常喜欢去调整各种启动参数,这没有多大意义,小伎俩. 性能优化要从架构和策略入手,才有可能得到较大的收益 Solr的查询是基于Field的,以Field为基本单元,例如一个文章站要索引 classArticle { String title; String content; String tags; } 查询参数: q=title:big && content:six Solr会顺序执行两次 field查询 ,这个开销非常大. 实际例子 :50万条记录,一次

hibernate SQL聚合查询

一次项目中使用hibernate 的templet方式执行普通sql,方式如下:String sql ="select count(*) as c from users";SQLQuery sq = session.createSQLQuery(sql);Object count = sq.uniqueResult();结果报错column '' can not found解决方法是设置返回列的类型,通过addScalar方法.如下所示:String sql ="selec