[转]组合过滤

https://es.xiaoleilu.com/080_Structured_Search/10_compoundfilters.html

这里有个完整文档

组合过滤

前面的两个例子展示了单个过滤器的使用。现实中,你可能需要过滤多个值或字段,例如,想在 Elasticsearch 中表达这句 SQL 吗?

SELECT product
FROM   products
WHERE  (price = 20 OR productID = "XHDK-A-1293-#fJ3")
  AND  (price != 30)

这些情况下,你需要 bool 过滤器。这是以其他过滤器作为参数的组合过滤器,将它们结合成多种布尔组合。

布尔过滤器

bool 过滤器由三部分组成:

{
   "bool" : {
      "must" :     [],
      "should" :   [],
      "must_not" : [],
   }
}

must:所有分句都必须匹配,与 AND 相同。

must_not:所有分句都必须不匹配,与 NOT 相同。

should:至少有一个分句匹配,与 OR 相同。

这样就行了!假如你需要多个过滤器,将他们放入 bool 过滤器就行。

提示: bool 过滤器的每个部分都是可选的(例如,你可以只保留一个 must 分句),而且每个部分可以包含一到多个过滤器

为了复制上面的 SQL 示例,我们将两个 term 过滤器放在 bool 过滤器的 should 分句下,然后用另一个分句来处理 NOT 条件:

GET /my_store/products/_search
{
   "query" : {
      "filtered" : { <1>
         "filter" : {
            "bool" : {
              "should" : [
                 { "term" : {"price" : 20}}, <2>
                 { "term" : {"productID" : "XHDK-A-1293-#fJ3"}} <2>
              ],
              "must_not" : {
                 "term" : {"price" : 30} <3>
              }
           }
         }
      }
   }
}

<1> 注意我们仍然需要用 filtered 查询来包裹所有条件。

<2> 这两个 term 过滤器是 bool 过滤器的子节点,因为它们被放在 should 分句下,所以至少他们要有一个条件符合。

<3> 如果一个产品价值 30,它就会被自动排除掉,因为它匹配了 must_not 分句。

我们的搜索结果返回了两个结果,分别满足了 bool 过滤器中的不同分句:

"hits" : [
    {
        "_id" :     "1",
        "_score" :  1.0,
        "_source" : {
          "price" :     10,
          "productID" : "XHDK-A-1293-#fJ3" <1>
        }
    },
    {
        "_id" :     "2",
        "_score" :  1.0,
        "_source" : {
          "price" :     20, <2>
          "productID" : "KDKE-B-9947-#kL5"
        }
    }
]

<1> 匹配 term 过滤器 productID = "XHDK-A-1293-#fJ3"

<2> 匹配 term 过滤器 price = 20

嵌套布尔过滤器

虽然 bool 是一个组合过滤器而且接受子过滤器,需明白它自己仍然只是一个过滤器。这意味着你可以在 bool 过滤器中嵌套 bool 过滤器,让你实现更复杂的布尔逻辑。

下面先给出 SQL 语句:

SELECT document
FROM   products
WHERE  productID      = "KDKE-B-9947-#kL5"
  OR (     productID = "JODL-X-1937-#pV7"
       AND price     = 30 )

我们可以将它翻译成一对嵌套的 bool 过滤器:

GET /my_store/products/_search
{
   "query" : {
      "filtered" : {
         "filter" : {
            "bool" : {
              "should" : [
                { "term" : {"productID" : "KDKE-B-9947-#kL5"}}, <1>
                { "bool" : { <1>
                  "must" : [
                    { "term" : {"productID" : "JODL-X-1937-#pV7"}}, <2>
                    { "term" : {"price" : 30}} <2>
                  ]
                }}
              ]
           }
         }
      }
   }
}

<1> 因为 termbool 在第一个 should 分句中是平级的,至少需要匹配其中的一个过滤器。

<2> must 分句中有两个平级的 term 分句,所以他们俩都需要匹配。

结果得到两个文档,分别匹配一个 should 分句:

"hits" : [
    {
        "_id" :     "2",
        "_score" :  1.0,
        "_source" : {
          "price" :     20,
          "productID" : "KDKE-B-9947-#kL5" <1>
        }
    },
    {
        "_id" :     "3",
        "_score" :  1.0,
        "_source" : {
          "price" :      30, <2>
          "productID" : "JODL-X-1937-#pV7" <2>
        }
    }
]

<1> productID 匹配第一个 bool 中的 term 过滤器。

<2> 这两个字段匹配嵌套的 bool 中的 term 过滤器。

这只是一个简单的例子,但是它展示了该怎样用布尔过滤器来构造复杂的逻辑条件。

时间: 2024-12-17 08:26:32

[转]组合过滤的相关文章

elasticsearch JAVA客户端操作---搜索的过滤、分组高亮

elasticsearch        提供的API比较多,看名字差不多可以明白什么意思 源码地址:源码下载点击 public void search01() { QueryBuilder query = QueryBuilders.queryString("9"); // 设置搜索的内容和现实的大小 SearchResponse res = client.prepareSearch("test").setQuery(query) .setFrom(0).setS

Mipmap与纹理过滤

为了加快渲染速度和减少纹理锯齿,贴图被处理成由一系列被预先计算和优化过的图片组成的文件,这样的贴图被称为Mipmap. 使用DirectX Texture Tool(DX自带工具)预生成Mipmap Chain Original  Mip1 Mip2 Mip3 Mip4 Mip5 Mip6 Mip7 Mip8 256x256 128x128 64x64 32x32 16x16 8x8 4x4 2x2 1x1 (1)Mipmap宽高值不一定要相等,但需要为2的n次幂,最低精度为1x1 (2)从原始

Wireshark过滤规则之:IP数据包过滤

Wireshark捕获经过指定ip的数据包 捕捉过滤抓包前在capture option中设置,仅捕获符合条件的包,可以避免产生较大的捕获文件和内存占用,但不能完整的复现测试时的网络环境. host 192.168.0.1 //抓取192.168.0.1 收到和发出的所有数据包src host 192.168.0.1 //源地址,192.168.0.1发出的所有数据包dst host 192.168.0.1 //目标地址,192.168.0.1收到的所有数据包 src host hostname

wireshark捕获/过滤指定ip地址数据包

转载 转载请注明出处:6san.com 原文地址: http://www.6san.com/630/ wireshark捕获/过滤指定ip地址数据包 使用捕获过滤或显示过滤,wireshark可以仅捕获/显示经过指定ip的数据包,即某个ip收到或发出的所有数据包.wireshark捕获/显示过滤使用方法见:"wireshark过滤器" 显示过滤:wireshark过滤经过指定ip的数据包 显示过滤可以完整的复现测试时的网络环境,但会产生较大的捕获文件和内存占用. ip.addr ==1

ELK学习总结(3-2)elk的filter查询过滤

和一般查询比较,filter查询能够缓存数据,应该尽可能使用 建立测试数据 查看测试数据 1.filtered查询 GET /store/products/_search { "query":{ "filtered":{ "query": { "match_all":{} }, filter:{ "terms":{ "price":[10,20] } } } } } ## 调用没有得到结

wireshark-003-常用显示过滤规则

根据协议过滤 举例:过滤http协议 举例:过滤TCP协议的数据 举例:过滤icmp协议 举例:过滤UDP协议 根据端口号过滤 1.举例:过滤tcp端口号为80的数据包(包含目标地址和源地址) 根据IP地址过滤 过滤IP地址为36.152.44.96的数据包(源地址和目标地址) 过滤源地址为36.152.44.96的数据包 3.过滤目标地址为36.152.44.96的数据包 组合过滤 过滤地址为36.152.44.96并且端口为443的数据包(www.baidu.com使用https协议进行数据

六种查找文档的方法及平时要做哪些优化?

能否较快找到文档和我们能回想起的关键字等有关, 也和平时是否根据查找方法特点所作的准备有关. 更多的查找方法,可以更好的利用我们能回想起来的内容,去找到. 是的,有的时连找到都是困难的,这个时候尝试更多的查找手段,是不错的选择. 下面介绍几种常用的查找方法, 及平时我们应该如何根据其特点作些准备, 以便时间久了后,我们还能较快的找到. 常用的查找方法有: 1.按文件名查找 2.按文件夹展开查找 3.按文档的全文查找 4.按标签查找 5.按日期查找 6.按公式查找 下述均以"文档大师"软

基于spark排序的一种更廉价的实现方案-附基于spark的性能测试

排序可以说是很多日志系统的硬指标(如按照时间逆序排序),如果一个大数据系统不能进行排序,基本上是这个系统属于不可用状态,排序算得上是大数据系统的一个"刚需",无论大数据采用的是hadoop,还是spark,还是impala,hive,总之排序是必不可少的,排序的性能测试也是必不可少的. 有着计算奥运会之称的Sort Benchmark全球排序每年都会举行一次,每年巨头都会在排序上进行巨大的投入,可见排序速度的高低有多么重要!但是对于大多数企业来说,动辄上亿的硬件投入,实在划不来.甚至远

hadoop、spark、hive、solr、es与YDB在车辆即席分析上的对比分析

自2012年以来,公安部交通管理局在全国范围内推广了机动车缉查布控系统(简称卡口系统),通过整合共享各地车辆智能监测记录等信息资源,建立了横向联网.纵向贯通的全国机动车缉查布控系统,实现了大范围车辆缉查布控和预警拦截.车辆轨迹.交通流量分析研判.重点车辆布控.交通违法行为甄别查处及侦破涉车案件等应用.在侦破肇事逃逸案件.查处涉车违法行为.治安防控以及反恐维稳等方面发挥着重要作用. 随着联网单位和接入卡口的不断增加,各省市区部署的机动车缉查布控系统积聚了海量的过车数据.截至目前,全国32个省(区.