信息统计分析-2

Range

按数值类型的字段聚合统计

{

"query": {

"match_all": {}

},

"aggs": {

"terms_sc-status": {

"range": {

"field": "time-taken",

"ranges": [

{

"key": "small",

"to": 200

},

{

"key": "medium",

"from": 200,

"to": 500

},

{

"key": "large",

"from": 500

}

]

},

"aggs": {

"avg_size": {

"stats": {

"field": "time-taken"

}

}

}

}

},

"size": 20

}

Date_range 对于时间类型的字段进行区段统计

{

"query": {

"match_all": {}

},

"aggs": {

"aggname": {

"date_range": {

"field": "@timestamp",

"format": "yyyy-MM-dd",

"ranges": [

{

"to":"now-2d" //统计范围:从最远点到当前日期的前2天

},

{

"from":"now-2d" //统计范围:从当前日期的前2天到现在

}

]

},

"aggs": {

"avg_size": {

"stats": {

"field": "time-taken"

}

}

}

}

},

"size": 20

}

Histogram 对字段按间隔进行统计

{

"query": {

"match_all": {}

},

"aggs": {

"terms_sc-status": {

"histogram": {

"field": "time-taken",

"interval": 5000,

"min_doc_count": 1 //获取doc_count>=0数据

},

"aggs": {

"avg_size": {

"stats": {

"field": "time-taken"

}

}

}

}

},

"size": 20

}

Date_histogram 对日期型字段统计,可以使用year(y)、month(M)、week(w)、day(d)、hour(h)、minute(m)等常量做作为interval属性的取值

{

"query": {

"match_all": {}

},

"aggs": {

"aggname": {

"date_histogram": {

"field": "@timestamp",

"format": "yyyy-MM-dd",

"interval": "1y", //间隔是1年,

"keyed": true, // 返回值的key作为json对象的名称

"min_doc_count": 1

},

"aggs": {

"avg_size": {

"stats": {

"field": "time-taken"

}

}

}

}

}

}

时间: 2024-10-01 09:52:59

信息统计分析-2的相关文章

基于HBase的MapReduce实现大量邮件信息统计分析

一:概述 在大多数情况下,如果使用MapReduce进行batch处理,文件一般是存储在HDFS上的,但这里有个很重要的场景不能忽视,那就是对于大量的小文件的处理(此处小文件没有确切的定义,一般指文件大小比较小,比如5M以内的文件),而HDFS的文件块一般是64M,这将会影响到HDFS的性能,因为小文件过多,那么NameNode需要保存的文件元信息将占用更多的空间,加大NameNode的负载进而影响性能,假如对于每个文件,在NameNode中保存的元数据大小是100字节,那么1千万这样的小文件,

Android代码片段

1.拨打电话 1 2 3 public static void call(Context context, String phoneNumber) { context.startActivity(new Intent(Intent.ACTION_CALL, Uri.parse("tel:" + phoneNumber))); } 2.跳转至拨号界面 1 2 3 public static void callDial(Context context, String phoneNumber

Atitit.log日志技术的最佳实践attilax总结

1. 日志的意义与作用1 1.1. 日志系统是一种不可或缺的单元测试,跟踪调试工具1 2. 俩种实现[1]日志系统作为一种服务进程存在 [2]日志系统作为系统调用存在2 3. 上下文(手动或者aop模式,记录参数)MDC2 3.1. 2 4. 日志格式规范2 4.1. 输出地点:日志,console,db2 5. 动态切换日志2 6. 大数据搜索与日志挖掘及可视化方案——ELK Stack:Elasticsearch.Logstash.Kibana (第2版)2 6.1. Web用户查询日志挖掘

Android--新手必备的常用代码片段整理(二)

收集设备信息用于信息统计分析 是否有SD卡 动态隐藏软键盘 动态显示软键盘 动态显示或者是隐藏软键盘 主动回到Home后台运行 获取状态栏高度 获取状态栏高度标题栏ActionBar高度 获取MCCMNC代码 SIM卡运营商国家代码和运营商网络代码 返回移动网络运营商的名字 返回移动终端类型 判断手机连接的网络类型2G3G4G 判断当前手机的网络类型WIFI还是234G 收集设备信息,用于信息统计分析 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

PySpark处理数据并图表分析

PySpark处理数据并图表分析 PySpark简介 官方对PySpark的释义为:"PySpark is the Python API for Spark". 也就是说pyspark为Spark提供的Python编程接口. Spark使用py4j来实现python与java的互操作,从而实现使用python编写Spark程序.Spark也同样提供了pyspark,一个Spark的python shell,可以以交互式的方式使用Python编写Spark程序. 如: from pysp

angular2之父子组件的调用

1.父组件ts /** * 描述:查询分析 * @version:1.0.0 * @author: zb * @创建时间: 2017-06-08 15:37:59 */ import { Component, OnInit, OnDestroy, ViewChild } from '@angular/core'; import { Router, ActivatedRouteSnapshot, NavigationEnd, RoutesRecognized } from '@angular/ro

Android开发常用代码片段

拨打电话 public static void call(Context context, String phoneNumber) { context.startActivity( new Intent(Intent.ACTION_CALL, Uri.parse( "tel:" + phoneNumber))); } 跳转至拨号界面 public static void callDial(Context context, String phoneNumber) { context.st

PMO在组织中实现价值应做的工作

PMO在组织中实现价值应做的工作 研发人员及项目经理常常对PMO有反感情绪,认为其不熟悉业务流程与技术.经常要求项目经理和研发人员提交形式化的材料,只审批和监控,不能为项目提供良好的服务.在很多企业,公司领导层认为PMO人员做事务性工作,只是消耗成本的管理部门,不能创造效益.一方面与研发人员观念有关,同时很重要的是PMO人员没有树立良好的服务意识,提供自己的产品,实现PMO的价值.笔者认为,PMO如果树立在管理中树立服务意识,明确自己提供的产品与服务,通过建立组织级项目管理体系,可为企业的发展创

基于位置信息的聚类算法介绍及模型选择

百度百科 聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类.由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异."物以类聚,人以群分",在自然科学和社会科学中,存在着大量的分类问题.聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法.聚类分析起源于分类学,但是聚类不等于分类.聚类与分类的不同在于,聚类所要求划分的类是未知的. 分类和聚类算法一直以来都是数据挖掘,机器学习领域的热门课题,因此产生了众多的