Elasticsearch学习笔记（三）聚合分析Agg

一、设置fielddata

PUT /index/_mapping/type

{
     "properties":{
          "fieldName":{
             "type":"text",
             "fielddata":true
         }
     }

}

例如：

PUT /ecommerce/_mapping/product

{
   "properties": {
     "tags":{
       "type": "text",
       "fielddata": true
     }
   }

}

二、聚合分析

1、聚合分析基本语法：

需求1：计算每个tag下的商品数量

GET /ecommerce/product/_search          // GET /index/type/_search

{
   "size": 0,   // 返回数据hits内不显示命中的数据记录
   "aggs": {
     "all_tags": { // 聚合器名称
       "AGG_TYPE": {      //AGG_TYPE聚合类型：terms，avg
         "field": "fieldName"//字段名称
       }
     }
   }

}

2、为聚合分析添加刷选条件

需求2：对名称中包含yagao的商品，计算每个tag下的商品数量

GET /ecommerce/product/_search

{
   "size": 0,
   "query": {
     "match": {
       "name": "yaogao"
     }
   },
   "aggs": {
     "all_tags": {
       "terms": {
         "field": "tags"
       }
     }
   }

}

3、嵌套聚合分析

需求3：先分组，再算每组的平均值，计算每个tag下的商品的平均价格

GET /ecommerce/product/_search

{
   "size": 0,
   "aggs": {
     "group_by_tags": {
       "terms": {
         "field": "tags"
       },
       "aggs": {
         "avg_price": {
           "avg": {
             "field": "price"
           }
         }
       }
     }
   }

}

4、聚合结果排序

需求4：计算每个tag下的商品的平均价格，并且按照平均价格降序排序

GET /ecommerce/product/_search

{
   "size": 0,
   "aggs": {
     "all_tags": {
       "terms": {
         "field": "tags",
         "order": {
           "avg_price": "asc"
         }
       },
       "aggs": {
         "avg_price": {
           "avg": {
             "field": "price"
           }
         }
       }
     }
   }

}

需求5：按照指定的价格范围区间进行分组，然后在每组内再按照tag进行分组，最后再计算每组的平均价格

GET /ecommerce/product/_search

{
   "size": 0,
   "aggs": {
     "group_by_price": {
       "range": {
         "field": "price",
         "ranges": [
           {
             "from": 0,
             "to": 20
           },{
             "from": 20,
             "to": 40
           },{
             "from": 40,
             "to": 50
           }
         ]
       },
       "aggs": {
         "all_tags": {
           "terms": {
             "field": "price"
           },
           "aggs": {
             "avg_price": {
               "avg": {
                 "field": "price"
               }
             }
           }
         }
       }
     }
   }

}

原文地址：https://www.cnblogs.com/wshcn/p/8150511.html

时间： 2025-01-08 09:47:06

Elasticsearch学习笔记（三）聚合分析Agg的相关文章

Elasticsearch学习之深入聚合分析三---案例实战

1. 统计指定品牌下每个颜色的销量任何的聚合,都必须在搜索出来的结果数据中进行,搜索结果,就是聚合分析操作的scope GET /tvs/sales/_search { "size": 0, "query": { "term": { "brand": { "value": "小米" } } }, "aggs": { "group_by_color"

Elasticsearch学习之深入聚合分析1--基本概念

首先明白两个核心概念:bucket和metric 1. bucket:一个数据分组 1 city name 2 3 北京小李 4 北京小王 5 上海小张 6 上海小丽 7 上海小陈基于city划分buckets,划分出来两个bucket,一个是北京bucket,一个是上海bucket 北京bucket:包含了2个人,小李,小王上海bucket:包含了3个人,小张,小丽,小陈按照某个字段进行bucket划分,那个字段的值相同的那些数据,就会被划分到一个bucket中,有一些mysql

Elasticsearch学习之深入聚合分析二---案例实战

以一个家电卖场中的电视销售数据为背景,来对各种品牌,各种颜色的电视的销量和销售额,进行各种各样角度的分析,首先建立电视销售的索引,然后添加几条销售记录 PUT /tvs { "mappings": { "sales": { "properties": { "price": { "type": "long" }, "color": { "type"

Elasticsearch学习之深入聚合分析四---案例实战

1. 需求:比如有一个网站,记录下了每次请求的访问的耗时,需要统计tp50,tp90,tp99 tp50:50%的请求的耗时最长在多长时间tp90:90%的请求的耗时最长在多长时间tp99:99%的请求的耗时最长在多长时间 PUT /website { "mappings": { "logs": { "properties": { "latency": { "type": "long"

Elasticsearch学习之深入聚合分析五---案例实战

1. fielddata核心原理 fielddata加载到内存的过程是lazy加载的,对一个analzyed field执行聚合时,才会加载,而且是field-level加载的,一个index的一个field,所有doc都会被加载,而不是少数doc,不是index-time创建,是query-time创建 2. fielddata内存限制 indices.fielddata.cache.size: 20%,超出限制,清除内存已有fielddata数据,fielddata占用的内存超出了这个比例的

Caliburn.Micro学习笔记(三)----事件聚合IEventAggregator和 Ihandle<T>

Caliburn.Micro学习笔记(三)----事件聚合IEventAggregator和 Ihandle<T> 今天说一下Caliburn.Micro的IEventAggregator和IHandle<T>分成两篇去讲这一篇写一个简单的例子看一它的的实现和源码下一篇用它们做一个多语言的demo 这两个是事件的订阅和广播,很强大,但用的时候要小心发生不必要的冲突. 先看一下它的实现思想在Caliburn.Micro里EventAggregator要以单例的形式出现这样可以

swift学习笔记(三)关于拷贝和引用

在swift提供的基本数据类型中,包括Int ,Float,Double,String,Enumeration,Structure,Dictionary都属于值拷贝类型. 闭包和函数同属引用类型捕获则为拷贝.捕获即定义这些常量和变量的原作用域已不存在,闭包仍然可以在闭包函数体内引用和修改这些值 class属于引用类型. Array的情况稍微复杂一些,下面主要对集合类型进行分析: 一.关于Dictionary:无论何时将一个字典实例赋给一个常量,或者传递给一个函数方法时,在赋值或调用发生时,都会

Time, Delays, and Deferred Work <LDD3> 学习笔记 + jiffies.h 分析

Time, Delays, and Deferred Work Dealing with time involves the following tasks, in order of increasing complexity: ? Measuring time lapses and comparing times ? Knowing the current time ? Delaying operation for a specified amount of time ? Scheduling

Boost Thread学习笔记三

下面先对condition_impl进行简要分析.condition_impl在其构造函数中会创建两个Semaphore(信号量):m_gate.m_queue,及一个Mutex(互斥体,跟boost::mutex类似,但boost::mutex是基于CriticalSection<临界区>的):m_mutex,其中:m_queue相当于当前所有等待线程的等待队列,构造函数中调用CreateSemaphore来创建Semaphore时,lMaximumCount参数被指定为(std::nume

小猪的数据结构学习笔记(三)

小猪的数据结构学习笔记(三) 线性表之单链表本章引言: 上一节中我们见识了第一个数据结构--线性表中的顺序表; 当你把操作的代码自己写几遍就会有点感觉了,如果现在让你写顺序表的插入算法,你能够想出大概的代码么?如果可以,那么你就可以进入新的章节了; 否则,还是回头看看吧!在本节,我们将迎来线性表的链式表示--单链表单链表和顺序表有什么优势和劣势呢?单链表的头插法和尾插法有什么不同呢? 请大家跟随笔者的脚步来解析线性表中的单链表把! 本节学习路线图路线图解析: ①先要理解顺序表和单链表各自