• 首页 首页 icon
  • 工具库 工具库 icon
    • IP查询 IP查询 icon
  • 内容库 内容库 icon
    • 快讯库 快讯库 icon
    • 精品库 精品库 icon
    • 问答库 问答库 icon
  • 更多 更多 icon
    • 服务条款 服务条款 icon

ElasticSearch实现子串查询

武飞扬头像
阳光&洒落
帮助1

match查询和term查询

match能够实现对查询字符串的模糊匹配,term实现对查询内容的精准匹配,通常可以用来处理数字(numbers)、布尔值(booleans)、日期(dates)以及文本(text)

精准查找价格为20的文档:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "filter": [
                {
                    "term": {
                        "price": 20
                    }
                }
            ]
        }
    }
}

实现子串的查询query_string

为了避免match执行时会将查询字符串进行分词、以及term完全匹配的特点,我们可以使用query_string语法来实现子串的查询,示例代码如下:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "query_string": {
                        "default_field": "table_name",
                        "query": "\"student_info\""
                    }
                }
            ]
        }
    }
}
学新通

query_string的查询块中指定了两个属性:default_field 指定要查询的字段,query 指定要查询的子串。上述代码的功能就是实现查找table_name字段中包含"student_info"字符串的文档。注意query字段中字符串的表示形式,需要显示的用双引号扩起来,才不会进行分词

想到这里就猜想,在match匹配时,将查询字符串显示的用双引号扩起来是不是也可以避免分词,答案是否定的。示例代码如下:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "table_name": {
                            "query": "\"student_info\""
                        }
                    }
                }
            ]
        }
    }
}
学新通

返回的查询结果显示仍然对query字符串进行了分词匹配,和直接使用不带双引号的查询字符串结果是一样的。

精准搜索字符串怎么破

为什么用term精准搜索字符串会失效,示例代码如下:

{
    "from": 0,
    "size": 10,
    "query": {
        "bool": {
            "must": [
                {
                    "term": {
                        "table_name": {
                            "value": "student_info"
                        }
                    }
                }
            ]
        }
    }
}
学新通

我们期望能搜索出table_name为"student_info"的文档,但是却没有返回结果。原因是在建立索引的时候,会对text类型的字段进行分词,然后建立索引,所以table_name字段的倒排索引中是不包含完整的"student_info"这个信息的。

如果要实现对text类型字段的精准匹配,在建立_mapping的时候就要指定:index:not_analyzed。告诉ElasticSearch该字段具有精确值,禁止对该字段的内容进行分词。同样也就失去了模糊匹配的能力

这篇好文章是转载于:学新通技术网

  • 版权申明: 本站部分内容来自互联网,仅供学习及演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,请提供相关证据及您的身份证明,我们将在收到邮件后48小时内删除。
  • 本站站名: 学新通技术网
  • 本文地址: /boutique/detail/tanhfjcihc
系列文章
更多 icon
同类精品
更多 icon
继续加载