elasticsearch学习之terms set 查询-kb88凯时官网登录

来自：网络

时间：2023-09-07

阅读：

什么是 terms set 查询？

查询根据匹配给定字段的精确术语的最少数量返回文档。

terms set 查询与 term 查询有何不同？

terms set query 和 terms query 之间的唯一区别是你可以提供必须匹配的最少数量的术语才能检索特定文档。

什么是 minimum_should_match_field 参数？

指向文档的数字（）字段名称，其值应用作要匹配的最少术语数，以便返回文档。

minimum_should_match_script 参数是什么？

一个自定义脚本，用于确定为了返回文档而必须匹配的最少术语数。如果你必须动态设置匹配所需的术语数，那么它将很有帮助。

示例

让我们首先创建索引：

`
 put product
 {
   "mappings": {
     "properties": {
       "name": {
         "type": "keyword"
       },
       "tags": {
         "type": "keyword"
        },
        "tags_count": {
          "type": "long"
        }
      }
    }
  }
`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

让我们索引样本文件：

`
  post product/_doc/prod1
  {
    "name":"iphone 13",
    "tags":["apple","iphone","mobile"],
    "tags_count":3
  }
  post product/_doc/prod2
  {
    "name":"iphone 12",
    "tags":["apple","iphone"],
    "tags_count":2
  }
  post product/_doc/prod3
  {
    "name":"iphone 11",
    "tags":["apple","mobile"],
    "tags_count":2
  }
`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

使用 minimum_should_match_field 参数查询：

用例 1：下面的查询将返回所有 3 个文档，因为 prod1 的最小术语匹配 (tags_count) 是 3，prod2 是 2，prod3 是 2，查询中传递了总共 3 个术语（"apple", "iphone", "mobile"）。

 post product/_search
 {
   "query": {
     "terms_set": {
       "tags": {
         "terms": [ "apple", "iphone", "mobile" ],
         "minimum_should_match_field": "tags_count"
       }
     }
    }
  }

上述查询的结果是：

 `    "hits": {
     "total": {
       "value": 3,
       "relation": "eq"
     },
     "max_score": 1.4010588,
     "hits": [
       {
         "_index": "product",
          "_id": "prod1",
          "_score": 1.4010588,
          "_source": {
            "name": "iphone 13",
            "tags": [
              "apple",
              "iphone",
              "mobile"
            ],
            "tags_count": 3
          }
        },
        {
          "_index": "product",
          "_id": "prod2",
          "_score": 0.7876643,
          "_source": {
            "name": "iphone 12",
            "tags": [
              "apple",
              "iphone"
            ],
            "tags_count": 2
          }
        },
        {
          "_index": "product",
          "_id": "prod3",
          "_score": 0.7876643,
          "_source": {
            "name": "iphone 11",
            "tags": [
              "apple",
              "mobile"
            ],
            "tags_count": 2
          }
        }
      ]
    }`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

用例二：下面的查询将只返回一个文档，因为查询中只传递了 2 个术语，仅与 prod3 匹配。 prod1 将不会返回，因为 tags_count 值为 3 并且查询中传递的总术语仅为 2。

 post product/_search
 {
   "query": {
     "terms_set": {
       "tags": {
         "terms": [ "apple", "mobile" ],
         "minimum_should_match_field": "tags_count"
       }
     }
    }
  }

上述查询的结果为：

 `    "hits": {
     "total": {
       "value": 1,
       "relation": "eq"
     },
     "max_score": 0.5007585,
     "hits": [
       {
         "_index": "product",
          "_id": "prod3",
          "_score": 0.5007585,
          "_source": {
            "name": "iphone 11",
            "tags": [
              "apple",
              "mobile"
            ],
            "tags_count": 2
          }
        }
      ]
    }`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

minimum_should_match_script 示例：

现在让我们看看如何使用 minimum should match 的动态值检索相同的索引数据。

在下面的示例中，查询中提供的术语总数的值将作为最小应匹配值传递。我们将使用 params.num_terms 来计算查询中提供的术语数。需要匹配的词条数不能超过 params.num_terms，即 terms 字段中提供的词条数。

 post product/_search
 {
   "query": {
     "terms_set": {
       "tags": {
         "terms": ["apple","iphone"],
         "minimum_should_match_script": {
           "source": "params.num_terms"
         }
        }
      }
    }
  }

它将返回 prod1 和 prod2，因为 minimum_should_match 值将设置为 2，因为我们在查询中仅传递了 2 个术语。上述命令的返回值为：

 `      "hits": [
       {
         "_index": "product",
         "_id": "prod2",
         "_score": 0.5007585,
         "_source": {
           "name": "iphone 12",
           "tags": [
             "apple",
              "iphone"
            ],
            "tags_count": 2
          }
        },
        {
          "_index": "product",
          "_id": "prod1",
          "_score": 0.5007585,
          "_source": {
            "name": "iphone 13",
            "tags": [
              "apple",
              "iphone",
              "mobile"
            ],
            "tags_count": 3
          }
        }
      ]
    }`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

让我们考虑一个场景，你想要考虑 tags_count 的最小值或查询中的术语数；在这种情况下，以下查询会有所帮助：

 post product/_search
 {
   "query": {
     "terms_set": {
       "tags": {
         "terms": ["apple","iphone"],
         "minimum_should_match_script": {
           "source": "math.min(params.num_terms, doc['tags_count'].value)"
         }
        }
      }
    }
  }

上述查询的结果为：

 `      "hits": [
       {
         "_index": "product",
         "_id": "prod2",
         "_score": 0.61233616,
         "_source": {
           "name": "iphone 12",
           "tags": [
             "apple",
              "iphone"
            ],
            "tags_count": 2
          }
        },
        {
          "_index": "product",
          "_id": "prod1",
          "_score": 0.61233616,
          "_source": {
            "name": "iphone 13",
            "tags": [
              "apple",
              "iphone",
              "mobile"
            ],
            "tags_count": 3
          }
        }
      ]
    }`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

terms set 查询 elasticsearch java 客户端

下面的代码将有助于使用 elasticsearch java 客户端实现术语集查询。

using new java api client (8.x)

`
 list tags = new arraylist();
 tags.add("apple");
 tags.add("iphone");
 // using minimum_should_match_field param
 query query1 = query.of(q -> q.bool(boolquery.of(bq -> bq.must(ts -> ts.termsset(
 		termssetquery.of(tq -> tq.field("tags").minimumshouldmatchfield("tags_count").terms(tags)))))));
 //using minimum_should_match_script param
  map param = new hashmap();
  query query1 = query
  		.of(q -> q.bool(boolquery.of(bq -> bq.must(ts -> ts.termsset(termssetquery.of(tq -> tq.field("tags")
  				.minimumshouldmatchscript(sc -> sc.inline(in -> in.lang("painless").source("params.num_terms").params(param)))
  				.terms(tags)))))));
`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

使用 java high level 客户端（已弃用）

`
 map param = new hashmap();
 script script = new script(scripttype.inline, "painless", "params.num_terms", param);
 list tags = new arraylist();
 tags.add("apple");
 tags.add("iphone");
 // using minimum_should_match_field
 querybuilder query = querybuilders.boolquery()
  		.must(new termssetquerybuilder("tags", tags).setminimumshouldmatchfield("tags_count"));
  // using minimum_should_match_script
  map param = new hashmap();
  script script = new script(scripttype.inline, "painless", "params.num_terms", param);
  querybuilder query = querybuilders.boolquery()
  		.must(new termssetquerybuilder("tags", tags).setminimumshouldmatchscript(script));
`![](https://csdnimg.cn/release/blogv2/dist/pc/img/newcodemorewhite.png)

以上就是elasticsearch学习之terms set 查询的详细内容，更多关于elasticsearch terms set 查询的资料请关注其它相关文章！

目录什么是 terms set 查询？terms set 查询与 term 查询有何不同？什么是 minimum_should_match_field 参数？minimum_should_match_script 参数是什么？示例使用 minimum_should_m

2023-09-07 21:35:32

yield()方法是thread类的静态方法，它可以停止当前正在执行的线程线程，并将给相同优先级的其他等待线程一个机会。如果没有等待线程或者所有等待线程都低优先级，则同一个线程将

2023-09-07 21:18:25

@jsonmanagedreference 和 @jsonbackreference 注释可用于在中创建 json 结构>双向方式。 @jsonmanagedreference 注释是在序列化过程中包含的前向引用，而 @jsonbackreferen

2023-09-06 17:19:19

java virtual machine 是一个程序/软件，它接收java字节码（.class文件）并将字节码（逐行）转换为机器可理解的代码。jvm 包含一个称为类加载器的模块。jvm 中的类加载器负责加载、链

2023-09-06 17:17:33

jlink 是一个新的链接器工具，用于创建我们自己的定制jre。通常，我们可以使用oracle提供的默认jre来运行我们的程序。如果我们需要创建自己的jre，那么就可以使用这个工具。jlink

2023-09-05 22:42:10

退格终端控制字符是用“\b”表示法表示的特殊字符。它用于将光标向后移动一个字符。它属于 java 转义字符，这些字符与反斜杠 (\) 一起使用，对编译器具有特殊含义。

2023-08-30 11:03:43

the json jackson is a library for java. it has very powerful data binding capabilities and provides a framework to serialize custom java objects to json and des

2023-08-30 10:59:42

语法public static java.lang.string tostring(jsonarray ja) throws jsonexceptionin the below example, we can convert a json array to csv format.exampleimport java

2023-08-21 21:25:07

引言：
多线程是java编程中常用的特性之一，但在多线程环境下，可能会出现线程死锁的异常，即线程之间互相等待对方释放资源而无法继续执行的情况。本文将讨论线程死锁异常的原因，并

2023-08-21 21:24:50

解决java访问权限异常（illegalaccessexception）的方法在java编程中，访问权限控制是保护类的成员不受未经授权的访问的重要方式。当我们尝试访问一个类的成员但没有足够的访问权

2023-08-21 21:24:19

解决java字符串转换为数字异常（numberformatexception）的方法在java编程中，经常遇到需要将字符串转换为数字的情况。然而，当字符串无法正确转换为数字时，就会抛出numberformatexc

2023-08-21 21:24:01

treemap是java collection framework的一个类，它实现了navigablemap接口。它将地图的元素存储在树结构中，并提供了一种有效的方法来按排序顺序存储键值对。换句话说，它总是以升

2023-08-21 21:23:42

mybatis是一个开源的持久层框架，它提供了一种将java对象映射到数据库操作的方式。在mybatis中，一级缓存和二级缓存是两种不同级别的缓存机制，它们都可以用来提高性能。一级缓存

2023-08-21 21:23:25

如何解决java网络超时异常（networktimeoutexception）网络超时异常是在java程序中经常遇到的一种异常类型，它表示网络连接在设定的时间内无法完成，常见的网络超时异常是networkti

2023-08-21 21:23:06

如何解决：java多线程错误：线程同步引言：
在java编程中，多线程是一种强大的技术，可以提升程序的性能和响应能力。然而，多线程编程也可能引发一些问题，其中一个常见的问题是线程同步

2023-08-21 21:22:49

public static void onspinwait()example的中文翻译为：示例public class threadonspinwaittest { public static void main(final string args[]) throws interruptedexcep

2023-08-21 21:22:30

在jshell工具中，可以使用内部命令"/vars"列出所有创建的变量。我们在jshell工具中有不同的"/vars"命令，如下所示。/vars/vars [id]/vars [variable_name]/vars -start/vars -a

2023-08-21 21:18:25

示例import org.json.*;public class jsonobjecttypevaluestest { public static void main(string[] args) throws jsonexception { jsonobject jsonobj = new json

2023-08-21 21:18:05

the java.lang.runtime类是object类的子类，可以提供有关程序运行环境的各种信息。java运行时环境创建与程序关联的此类的单个实例。runtime类没有任何公共构造函数，因此程序无

2023-08-21 21:17:45

in our digitized era where large amounts of information are produced every day around the globe; managing information storage methods efficiently has become cru

2023-08-21 21:17:21

java开发中对接百度ai接口时如何确保数据的隐私保护和合规性引言：
随着人工智能（ai）技术的快速发展，越来越多的开发者开始在自己的项目中使用百度ai接口，以实现图像识别、语音识

2023-08-14 22:39:22

java语言下如何对接百度ai接口实现人脸识别引言：
随着人工智能技术的不断发展，人脸识别技术已经广泛应用于各个领域，比如安防监控、人脸支付等。作为一种常用的编程语言，java具

2023-08-14 22:39:06

如何在java项目中集成并使用百度ai接口的自然语言处理功能摘要：随着人工智能的快速发展，自然语言处理（nlp）已经成为应用广泛的技术之一。百度ai提供了强大的自然语言处理接口，如

2023-08-14 22:38:48

百度ai接口在java开发中的应用案例解析与总结随着人工智能技术的不断发展和应用，百度ai接口作为其中的一员，被广泛应用于各行各业。本文将对百度ai接口在java开发中的应用案例

2023-08-14 22:38:31

java程序员如何灵活使用百度ai接口进行开发随着人工智能技术的迅猛发展，越来越多的开发者开始将人工智能技术应用于自己的项目中。作为一名java程序员，我们可以利用百度提供的

2023-08-14 22:38:01

概述
百度ai接口提供了强大的人工智能功能，包括语音识别、图像识别等。在java开发过程中，我们可能会使用到百度ai接口来处理敏感信息，为了保护用户数据的安全性，我们需要对这些

2023-08-14 22:37:43

目录checkpoint 机制的具体实现backnode 节点冷备份checkpoint 的实现checkpoint 机制的具体实现我们都知道为了优化分布式存储系统中 namenode 的重启性能，我们引进了 check

2023-07-31 21:47:46

目录一、java后端使用multipartfile二、java后端直接从request中读取并转换为字符串三、java后端直接从request中读取并存入本地文件四、前端使用el-upload1.el-upload使用2

2023-07-31 21:47:17

目录mybatis传入list集合查询数据主要有两点问题mybatis传入list集合批量删除总结mybatis传入list集合查询数据使用的是ssm框架，数据库是mysql，做查询的时候传入list集合，使用s

2023-07-31 21:46:59

演示 - 初始化销毁顺序/* 初始化和销毁的执行顺序 */@springbootapplicationpublic class a07_1 { public static void main(string[] args) { configurableap

2023-07-31 21:46:43

2021-02-06

2020-09-18

2020-12-12

2020-05-05

2020-11-20

2021-01-09

2020-09-25

2021-02-06

2021-03-07

2020-09-27

elasticsearch学习之terms set 查询-kb88凯时官网登录

目录

什么是 terms set 查询？

terms set 查询与 term 查询有何不同？

什么是 minimum_should_match_field 参数？

minimum_should_match_script 参数是什么？

示例

使用 minimum_should_match_field 参数查询：

minimum_should_match_script 示例：

terms set 查询 elasticsearch java 客户端

using new java api client (8.x)

使用 java high level 客户端（已弃用）

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道