Elasticsearch学习之深入聚合分析1--基本概念

首先明白两个核心概念：bucket和metric

1. bucket：一个数据分组

1 city name
2
3 北京 小李
4 北京 小王
5 上海 小张
6 上海 小丽
7 上海 小陈

基于city划分buckets，划分出来两个bucket，一个是北京bucket，一个是上海bucket

北京bucket：包含了2个人，小李，小王
上海bucket：包含了3个人，小张，小丽，小陈

　　按照某个字段进行bucket划分，那个字段的值相同的那些数据，就会被划分到一个bucket中，有一些mysql的sql知识的话，聚合，首先第一步就是分组，对每个组内的数据进行聚合分析，分组，就是我们的bucket

2. metric：对一个数据分组执行的统计

　　当我们有了一堆bucket之后，就可以对每个bucket中的数据进行聚合分词了，比如说计算一个bucket内所有数据的数量，或者计算一个bucket内所有数据的平均值，最大值，最小值，metric，就是对一个bucket执行的某种聚合分析的操作，比如说求平均值，求最大值，求最小值

举例如下：

select count(*)
from access_log
group by user_id

bucket：group by user_id --> 那些user_id相同的数据，就会被划分到一个bucket中
metric：count(*)，对每个user_id bucket中所有的数据，计算一个数量

时间： 2024-12-14 18:04:50

Elasticsearch学习之深入聚合分析1--基本概念的相关文章

Elasticsearch学习之深入聚合分析二---案例实战

以一个家电卖场中的电视销售数据为背景,来对各种品牌,各种颜色的电视的销量和销售额,进行各种各样角度的分析,首先建立电视销售的索引,然后添加几条销售记录 PUT /tvs { "mappings": { "sales": { "properties": { "price": { "type": "long" }, "color": { "type"

Elasticsearch学习之深入聚合分析三---案例实战

1. 统计指定品牌下每个颜色的销量任何的聚合,都必须在搜索出来的结果数据中进行,搜索结果,就是聚合分析操作的scope GET /tvs/sales/_search { "size": 0, "query": { "term": { "brand": { "value": "小米" } } }, "aggs": { "group_by_color"

Elasticsearch学习之深入聚合分析四---案例实战

1. 需求:比如有一个网站,记录下了每次请求的访问的耗时,需要统计tp50,tp90,tp99 tp50:50%的请求的耗时最长在多长时间tp90:90%的请求的耗时最长在多长时间tp99:99%的请求的耗时最长在多长时间 PUT /website { "mappings": { "logs": { "properties": { "latency": { "type": "long"

Elasticsearch学习之深入聚合分析五---案例实战

1. fielddata核心原理 fielddata加载到内存的过程是lazy加载的,对一个analzyed field执行聚合时,才会加载,而且是field-level加载的,一个index的一个field,所有doc都会被加载,而不是少数doc,不是index-time创建,是query-time创建 2. fielddata内存限制 indices.fielddata.cache.size: 20%,超出限制,清除内存已有fielddata数据,fielddata占用的内存超出了这个比例的

ElasticStack学习（八）：ElasticSearch索引模板与聚合分析初探

一.Index Template与Dynamic Template的概念 1.Index Template:它是用来根据提前设定的Mappings和Settings,并按照一定的规则,自动匹配到新创建的索引上. 1)模板仅是一个索引被创建时才会起作用,修改模板并不会影响已创建的索引: 2)可以设定多个索引模板,这些设置会被merge在一起: 3)通过指定order的数值,控制merge的过程: 2.Index Template的工作方式如下: 当一个索引被创建时,会执行如下操作: 1)应用Ela

elasticsearch系列六：聚合分析（聚合分析简介、指标聚合、桶聚合）

一.聚合分析简介 1. ES聚合分析是什么? 聚合分析是数据库中重要的功能特性,完成对一个查询的数据集中数据的聚合计算,如:找出某字段(或计算表达式的结果)的最大值.最小值,计算和.平均值等.ES作为搜索引擎兼数据库,同样提供了强大的聚合分析能力. 对一个数据集求最大.最小.和.平均值等指标的聚合,在ES中称为指标聚合 metric 而关系型数据库中除了有聚合函数外,还可以对查询出的数据进行分组group by,再在组上进行指标聚合.在 ES 中group by 称为分桶,桶聚合 bucke

Elasticsearch学习之嵌套聚合，下钻分析，聚合分析

1. 计算每个tag下的商品数量 GET /ecommerce/product/_search { "aggs": { "group_by_tags": { "terms": { "field": "tags" } } } } 2. 将文本field的fielddata属性设置为true PUT /ecommerce/_mapping/product { "properties": {

Elasticsearch学习笔记（三）聚合分析Agg

一.设置fielddata PUT /index/_mapping/type { "properties":{ "fieldName":{ "type":"text", "fielddata":true } } } 例如: PUT /ecommerce/_mapping/product { "pr

Elasticsearch 之聚合分析入门

本文主要介绍 Elasticsearch 的聚合功能,介绍什么是 Bucket 和 Metric 聚合,以及如何实现嵌套的聚合. 首先来看下聚合(Aggregation): 什么是 Aggregation? 首先举一个生活中的例子,这个是京东的搜索界面,在搜索框中输入"华为"进行搜索,就会得到如上界面,搜索框就是我们常用的搜索功能,而下面这些,比如分类.热点.操作系统.CPU 类型等是根据 ES 的聚合分析获得的相关结果. 看完上面这个例子,下面来看下聚合的定义: ES 除了搜索以外,

猜你喜欢

JVM性能调优

一.JVM性能调优策略二.性能调优 1.Java线程池(java.util.concurrent.ThreadPoolExecutor) 大多数JVM6上的应用采用的线程池都是JDK自带的线程池,之 ...

matlab 工具之各种降维方法工具包，下载及使用教程，有PCA， LDA，等等。。。

最近跑深度学习,提出的feature是4096维的,放到我们的程序里,跑得很慢,很慢.... 于是,一怒之下,就给他降维处理了,但是matlab 自带的什么pca( ), princomp( )函数, ...

Java常量定义

/** * char 类型常量 */ private static final char CHAR = 'A'; /** * byte 类型常量 */ private static final byt ...

MSP430x1_4_6x之问题总结

01:MSP430端口上电复位的初始值是不确定的:所以使用是都要初始化:比如加下面的语句或者加你使用的端口就行了: /*下面六行程序关闭所有的IO口*/ P1DIR = 0XFF;P1OUT ...

通用权限管理系统接口文档V4.2 版本之消息接口介绍

通用权限管理系统提供的消息接口可实现消息获取,消息发送,底层使用Redis对消息进行缓存,解决消息的并发请求对数据库的压力. 前端可以通过客户端轮询来获取最新消息,前端效果截图如下: 1.发送消息 2 ...

redis安装和配置

redis安装和配置 1.安装编译工具 yum install wget? make gcc gcc-c++ zlib-devel openssl openssl-devel pcre-devel k ...

逆序的三位数C语言实现

最近在上浙江大学翁恺老师的<程序设计入门-C语言>课,翁老师那富有男性特有魅力的磁性嗓音深深吸引了我....虽然我是男的.课程首周有个测试题: 题目内容: 程序每次读入一个正三位数,然后输 ...

Activity标题（title）的显示和隐藏

开发Android应用程序,我们总会遇到Activity的title把显示的内容遮挡了一部分.如果能把它去掉,我们的应用界面就会变得更加简洁,那该多好.下面有两种方法可以去掉: (方法一):通过一句J ...

学习Android开发相关站点汇总

Google免FQ镜像汇总 stackoverflow Android基础&进阶深入理解Android 老罗的Android之旅 Android 精彩案例 Android源码解读 Andro ...

【cl】selenium实例一：打开百度，获取第四个标题

/*创建类的时候是TestNG Class*/ package Selenium_lassen; import static org.junit.Assert.*; import java.util. ...

[原]Unity3D深入浅出 - 粒子系统

粒子系统是在三维控件渲染出来的二维图像,主要用于烟,火,水滴,落叶等效果.一个粒子系统由例子发射器.粒子动画器和粒子渲染器三个独立的部分组成. Unity中自带了一些粒子效果,在Assets>I ...

Innobackupex全备恢复（原理、演示）

一. Innobackupex恢复原理 After creating a backup, the data is not ready to be restored. There might b ...

获取表的信息，包含字段的描述

--获取数据库中的表select name from sysobjects where type='U'--获取表字段 Select name from syscolumns ------------ ...

POJ2406 Power Strings(KMP,后缀数组)

这题可以用后缀数组,KMP方法做后缀数组做法开始想不出来,看的题解,方法是枚举串长len的约数k,看lcp(suffix(0), suffix(k))的长度是否为n- k ,若为真则len / k即 ...

Vijos P1034家族

题目来源:https://www.vijos.org/p/1034 P1034家族请登录后递交标签:[显示标签] 描述若某个家族人员过于庞大,要判断两个是否是亲戚,确实还很不容易,现在给出某个亲 ...

工具让生活更美好

工欲善其事,必先利其器. 如果你工作中使用MySQL数据库,却从来没安装其他的MySQL工具,我只能说:牛逼中的战斗机.我就一打酱油的,都是使用MySQL工具操作的:偶尔使用cmd命令行,结果总是蛋疼 ...

Android Studio 中删除项目和项目找回------ Project Structure的使用

删除项目点击File--Project Structure 在Project Structure页面,选中要删除的项目,点击上面的减号图标. 我把两个一起删除了,再次打开时,啥也没有如果想要把不要 ...

特殊字符替换 > < " ' &

function toTXT(str){ var RexStr = /\<|\>|\"|\'|\&/g str = str.replace ...

mysql中怎样查看和删除唯一索引

mysql中怎样查看和删除唯一索引. 查看唯一索引: show index from mytable;//mytable 是表名查询结果例如以下: 查询到唯一索引后,怎样删除唯一索引呢,使用例如以下 ...

hiho一下120周后缀数组一·重复旋律

后缀数组一·重复旋律时间限制:5000ms 单点时限:1000ms 内存限制:256MB 描述小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一个音乐旋律被表示为长度为 N 的数构成的数列. 小Hi ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.