elasticsearch term match multi_match区别

转自：http://www.cnblogs.com/yjf512/p/4897294.html

match

最简单的一个match例子：

查询和"我的宝马多少马力"这个查询语句匹配的文档。

{
  "query": {
    "match": {
        "content" : {
            "query" : "我的宝马多少马力"
        }
    }
  }
}

上面的查询匹配就会进行分词，比如"宝马多少马力"会被分词为"宝马多少马力", 所有有关"宝马多少马力", 那么所有包含这三个词中的一个或多个的文档就会被搜索出来。

并且根据lucene的评分机制(TF/IDF)来进行评分。

match_phrase

比如上面一个例子，一个文档"我的保时捷马力不错"也会被搜索出来，那么想要精确匹配所有同时包含"宝马多少马力"的文档怎么做？就要使用 match_phrase 了

{
  "query": {
    "match_phrase": {
        "content" : {
            "query" : "我的宝马多少马力"
        }
    }
  }
}

完全匹配可能比较严，我们会希望有个可调节因子，少匹配一个也满足，那就需要使用到slop。

{
  "query": {
    "match_phrase": {
        "content" : {
            "query" : "我的宝马多少马力",
            "slop" : 1
        }
    }
  }
}

multi_match

如果我们希望两个字段进行匹配，其中一个字段有这个文档就满足的话，使用multi_match

{
  "query": {
    "multi_match": {
        "query" : "我的宝马多少马力",
        "fields" : ["title", "content"]
    }
  }
}

但是multi_match就涉及到匹配评分的问题了。

我们希望完全匹配的文档占的评分比较高，则需要使用best_fields

{
  "query": {
    "multi_match": {
      "query": "我的宝马发动机多少",
      "type": "best_fields",
      "fields": [
        "tag",
        "content"
      ],
      "tie_breaker": 0.3
    }
  }
}

意思就是完全匹配"宝马发动机"的文档评分会比较靠前，如果只匹配宝马的文档评分乘以0.3的系数

我们希望越多字段匹配的文档评分越高，就要使用most_fields

{
  "query": {
    "multi_match": {
      "query": "我的宝马发动机多少",
      "type": "most_fields",
      "fields": [
        "tag",
        "content"
      ]
    }
  }
}

我们会希望这个词条的分词词汇是分配到不同字段中的，那么就使用cross_fields

{
  "query": {
    "multi_match": {
      "query": "我的宝马发动机多少",
      "type": "cross_fields",
      "fields": [
        "tag",
        "content"
      ]
    }
  }
}

term

term是代表完全匹配，即不进行分词器分析，文档中必须包含整个搜索的词汇

{
  "query": {
    "term": {
      "content": "汽车保养"
    }
  }
}

查出的所有文档都包含"汽车保养"这个词组的词汇。

使用term要确定的是这个字段是否“被分析”(analyzed)，默认的字符串是被分析的。

时间： 2024-10-13 02:31:13

elasticsearch term match multi_match区别的相关文章

转转转---js正则表达exec与match的区别说明

正则表达式对象有两个定义方式:: 1.第一种定义: new RegExp(pattern, attributes);如var reg = new RegExp("abc","g") 其中pattern为表示表达式内容,如上表示匹配abc attributes:g,全局匹配,i不区分大小写,m执行多行匹配,用最多的为g和i 2.第二种定义:/pattern/attributes. 如:var reg = /abc/g; 正则表达的规则一些规则在此不再说明,只记录exe

javascript正则表达式exec()与match()的区别说明

本篇文章主要是对js正则表达exec与match的区别进行了介绍,需要的朋友可以过来参考下,希望对大家有所帮助. 正则表达的规则一些规则在此不再说明,只记录exec和match的区别: 1.exec是正则表达式的方法,而不是字符串的方法,它的参数才是字符串,如下所示: 如上定义 var reg = new RegExp("abc") ; var str = "3abc4,5abc6";reg.exec(str ); 2.match是字符串执行匹配正则表达式规则的方法

ES query_string match的区别之一

今天线上发现一个问题,从而引出对query_string 和 match 的区别的思考. curl -XGET 'http://localhost:9200/*/offer/_search?pretty' -d '{ "from" : 0, "size" : 10, "fields" : ["title"], "query": { "query_string" : { "que

Elasticsearch查询match、term和bool区别

es中的查询请求有两种方式,一种是简易版的查询,另外一种是使用JSON完整的请求体,叫做结构化查询(DSL).由于DSL查询更为直观也更为简易,所以大都使用这种方式.DSL查询是POST过去一个json,由于post的请求是json格式的,所以存在很多灵活性,也有很多形式.这里有一个地方注意的是官方文档里面给的例子的json结构只是一部分,并不是可以直接黏贴复制进去使用的.一般要在外面加个query为key的机构. match最简单的一个match例子: 查询和"我的宝马多少马力"这个

js正则函数中test和match的区别

test是RegExp的方法,参数是字符串,返回值是boolean类型. match是String的方法,参数是正则表达式,返回值是数组. 1 <script type="text/javascript"> 2 var str="javascript is good,java"; 3 console.log(str.match(/java/gi)); //返回时数组 4 </script> var str="javascript i

JavaScript中正则表达式test()、exec()、match() 方法区别

1)test()方法 var str = "wzltestreg"; var reg = new RegExp("wzl", ""); alert(reg.test(str)); // true test 返回 Boolean,查找对应的字符串中是否存在模式. 2)RegExp类的方法exec(string) http://www.cnblogs.com/xiehuiqi220/archive/2008/12/01/1327487.html 3)

elasticsearch term 查询

1.前言 term级别查询将按照存储在倒排索引中的确切字词进行操作,这些查询通常用于数字,日期和枚举等结构化数据,而不是全文本字段. 或者,它们允许您制作低级查询,并在分析过程之前进行. term级别的查询包括以下几种查询方式: 1.1.term query term是代表完全匹配,也就是精确查询,搜索前不会再对搜索词进行分词,所以我们的搜索词必须是文档分词集合中的一个.比如说我们要找标题为北京奥运的所有文档

Python里面search()和match()的区别

match()函数只检测字符串开头位置是否匹配,匹配成功才会返回结果,否则返回None import re print(re.match("func", "function")) # 打印结果 <_sre.SRE_Match object; span=(0, 4), match='func'> print(re.match("func", "function").span()) # 打印结果 (0, 4) prin

python题目-----search()和match()的区别

1. match()函数只检测re是不是在string的开始位置匹配,也就是说match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none 2. search()会扫描整个string查找匹配例如: import re print(re.match("good", "morning good").span()) #报错分会none print(re.match("good", "good