分布式搜索引擎ElasticSearch(插入数据及java api 二)

通过Aggregation来分组查询：

　　

SearchResponse response = client.prepareSearch(INDEX_DOUBAN).setTypes(TYPE_DOUBAN)
　　.addAggregation(
　　　　　　AggregationBuilders.terms("by_"+tag).field(tag).size(1000)
　　　　　　　　　　　　　　)

.execute().actionGet();

Terms terms = response.getAggregations().get("by_"+tag);
for(Bucket b:terms.getBuckets()){
// Sum sum = b.getAggregations().get("sum");
list.add((String) b.getKey());
//System.out.println("filedname:"+b.getKey()+" docCount:"+b.getDocCount());
}

这里要注意的是：返回数量不是和之前一样setSize(),而是要设置AggregationBuilders的size才行；其次：对于非数字和英文的字段，这样的组合查询默认会进行分词处理，所以要用mapping来设置字段的分词与否，这部分后面详细叙述。

时间： 2024-10-18 12:02:12

分布式搜索引擎ElasticSearch(插入数据及java api 二)的相关文章

分布式搜索引擎Elasticsearch安装配置

分布式搜索引擎Elasticsearch 介绍 Elasticsearch是一个基于Lucene的开源分布式搜索引擎,具有分布式多用户能力.Elasticsearch是用java开发,提供Restful接口,能够达到实时搜索.高性能计算:同时Elasticsearch的横向扩展能力非常强,不需要重启服务,基本上达到了零配置.但是目前来说相关资料很少,同时版本更新很快,bug存在,API繁多并且变化. 概念和设计索引索引(index)是Elasticsearch存放数据的地方.如果你熟悉关系型

一个开源的分布式搜索引擎---Elasticsearch（未完待续）

今天给大家介绍一个开源的分布式搜索引擎Elasticsearch. 一.ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎, 基于RESTful web接口.Elasticsearch是用Java开发的,并作为Apache 许可条款下的开放源码发布,是第二最流行的企业搜索引擎.设计用于云计算中,能够达到实时搜索, 稳定,可靠,快速,安装使用方便. 我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的.我们希望我们的

ubuntu12.04+kafka2.9.2+zookeeper3.4.5的分布式集群安装和demo(java api)测试

博文作者:迦壹博客地址:http://idoall.org/home.php?mod=space&uid=1&do=blog&id=547 转载声明:可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明,谢谢合作! --------------------------------------- 目录: 一.什么是kafka? 二.kafka的官方网站在哪里? 三.在哪里下载?需要哪些组件的支持? 四.如何安装? 五.FAQ 六.扩展阅读一.什么是kafka? ka

kafka2.9.2的分布式集群安装和demo(java api)测试

目录: 一.什么是kafka? 二.kafka的官方网站在哪里? 三.在哪里下载?需要哪些组件的支持? 四.如何安装? 五.FAQ 六.扩展阅读一.什么是kafka? kafka是LinkedIn开发并开源的一个分布式MQ系统,现在是Apache的一个孵化项目.在它的主页描述kafka为一个高吞吐量的分布式(能将消息分散到不同的节点上)MQ.Kafka仅仅由7000行Scala编写,据了解,Kafka每秒可以生产约25万消息(50 MB),每秒处理55万消息(110 MB). kafka目

mongoDB 插入数据用java实现

import java.net.UnknownHostException; import com.mongodb.BasicDBObject; import com.mongodb.DB; import com.mongodb.DBCollection; import com.mongodb.DBObject; import com.mongodb.Mongo; /** * 用java 往mongoDB插入数据 * @author wwd * */ public class InsertD

分布式搜索引擎Elasticsearch的简单使用

官方网址:https://www.elastic.co/products/elasticsearch/ 一.特性 1.支持中文分词 2.支持多种数据源的全文检索引擎 3.分布式 4.基于lucene的开源搜索引擎 5.Restful api 二.资源 smartcn, 默认的中文分词 :https://github.com/elasticsearch/elasticsearch-analysis-smartcn mmseg :https://github.com/medcl/elasticsea

ElasticSearch logo 分布式搜索引擎 ElasticSearch

原文来自:http://www.oschina.net/p/elasticsearch Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引. ElasticSearch 提供多种语言的客户端 API: Java API — 1.x — other versions JavaScript API — 2.4 — other versions

kafka2.9.2的伪分布式集群安装和demo(java api)测试

1.什么是kafka? kafka是LinkedIn开发并开源的一个分布式MQ系统,现在是Apache的一个孵化项目.在它的主页描述kafka为一个高吞吐量的分布式(能将消息分散到不同的节点上)MQ.Kafka仅仅由7000行Scala编写,据了解,Kafka每秒可以生产约25万消息(50 MB),每秒处理55万消息(110 MB). kafka目前支持多种客户端语言:java,python,c++,php等等. kafka集群的简要图解如下,producer写入消息,consumer读取消息

分布式搜索引擎Elasticsearch PHP类封装使用原生api

<?php class ElasticSearch { public $index; function __construct($server = 'http://localhost:9200'){ $this->server = $server; } function call($path, $http = array()){ if (!$this->index) throw new Exception('$this->index needs a value'); return

猜你喜欢

【笔试】11、数字组合

/** * 题目:有1.2.3.4四个数字,能组成多少个互不相同且无重复数字的三位数?都是多少? * 时间:2015年7月29日08:31:58 * 文件:Lianxi11.java * 作者:cut ...

辗转相除求最大公约数与最小公倍数

#include<stdio.h> int gcd(int a,int b) { if(b!=0) gcd(b,a%b); else return a; } int lcm(int a,i ...

如何直接在github网站上更新你fork的repo?

玩过github的人一定会在你自己的账号上fork了一些github开源项目.这些开源项目往往更新比较活跃,你今天fork用到你自己的项目中去了,过几个星期这个fork的origin可能有一些bugf ...

python时间处理汇总

日期时间处理模块: time calendar 当前时间戳: time.time() 以秒为单位的小数日期范围:1970-01-01 到 2038年时间元组: 获取当前时间戳:time.t ...

List与Set的使用

接口Collection: Collection是Java的一个集合框架, 也是一个根接口.JDK中没有提供此接口的任何实现,但是提供了更具体的子接口Set和List接口的实现,所有的Collecti ...

<编程珠玑>笔记(二) 程序验证

在芯片设计(IC)领域有专门的职位叫做芯片验证工程师,其中的一种方法叫形式验证(Formal Verification),具体包括等价性检查,模型检查和定理证明. 本章所讲的程序验证方法(不要与软件测 ...

SDUT 2778-小明的花费预算（二分答案）

小明的花费预算 Time Limit: 1000ms Memory limit: 65536K 有疑问?点这里^_^ 题目描述小明终于找到一份工作了,但是老板是个比较奇怪的人,他并不是按照每月 ...

排序算法（五）

2. 选择排序—堆排序(Heap Sort) 堆排序是一种树形选择排序,是对直接选择排序的有效改进. 基本思想: 堆的定义如下:具有n个元素的序列(k1,k2,...,kn),当且仅当满足时称之为堆 ...

APACHE + LDAP 的权限认证配置方法

原文地址:http://www.chinaunix.net/jh/49/627646.html一.前言很多朋友希望利用 Apache 通过 LDAP 进行用户认证及权限管理. 通过多 ...

Spark on Yarn部署

环境:Linux, 8G 内存,60G 硬盘,Hadoop 2.2.0,Spark 1.0.0, Scala 2.10.3 1. 安装Hadoop Yarn 集群 http://blog.csdn.n ...

Centos 6 Oracle 12C 超详细安装

Install Oracle Database 12c. Before Installing, Change some settings for requirements of installin ...

简单的canvas时钟

1 <!DOCTYPE html> 2 <html lang="en"> 3 <head> 4 <meta charset="U ...

D - 娜娜梦游仙境系列——村民的怪癖

D - 娜娜梦游仙境系列——村民的怪癖 Time Limit: 2000/1000MS (Java/Others) Memory Limit: 128000/64000KB (Java/Othe ...

VC6.0 设置动态链接库工程生成dll以及lib文件的位置

在"Projet"->"Settings..."的"Link"选项卡中 "Output file name"中设置 ...

告别了一段时间

时间长了就想写这篇文章! 其实,这是不是真的文章,依靠的就是自己一个警钟.或者提示.不得不踏上了六个月的旅程再次考研,去年考研的三个月.加上考研之后的一段时间去找学校调剂,找工作去实习,总感觉跟自己的 ...

国际人类蛋白质组计划

国际人类蛋白质组计划(HPP)是继国际人类基因组计划之后的又一项大规模的国际性科技工程.首批行动计划包括由中国科学家牵头的“人类肝脏蛋白质组计划”和美国科学家牵头的“人类血浆蛋白质组计划”.“人类肝脏 ...

基于Dynamic Proxy技术的方法AOP拦截器开发

在面向对象编程中,会用到大量的类,并且会多次调用类中的方法.有时可能需要对这些方法的调用进行一些控制.如在权限管理中,一些用户没有执行某些方法的权限.又如在日志系统中,在某个方法执行完后,将其执行的结 ...

蓝桥杯评测_前n项和

问题描述求1+2+3+...+n的值. 输入格式输入包括一个整数n. 输出格式输出一行,包括一个整数,表示1+2+3+...+n的值. 样例输入 4 样例输出 10 样例输入 100 说明:有一 ...

对某钓鱼网站的一次失败渗透分析

无聊正玩着手机QQ空间,发现来了一条消息,就打开看了下. 看见有人@了我一下标题挺吸引人的,呵呵...有点常识经验的一看就知道不是什么好事的,然后点开看了下可以发现此号@了很多和这个号有联系的Q ...

视类主要用来向界面显示内容用的,与显示无前的内容都不会放到这里.在本例子里,主要用来向窗口画直线和在窗口固定位置显示当前鼠标所在位置.在Windows的画直线,就是调用它的API函数LineTo来实现 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.