Mongodb多键索引中索引边界的混合

news/2024/8/26 9:58:59 标签: 数据库, mongodb

学习mongodb,体会mongodb的每一个使用细节,欢迎阅读威赞的文章。这是威赞发布的第93篇mongodb技术文章,欢迎浏览本专栏威赞发布的其他文章。如果您认为我的文章对您有帮助或者解决您的问题,欢迎在文章下面点个赞,或者关注威赞。谢谢。

Mongodb为提高数组的查询效率,针对数组构建了多键索引。而Mongodb在应用多键数组查询时,也通过构建,减少数组查询的数值范围,来提高查询性能。本文结合Mongodb官方文档,阐述Mongodb在使用多键索引时的边界优化。

概述

索引边界定义了索引值的区间段。Mongodb在查询时,用这个区间段来查询索引中的数据。当用户针对索引字段指定多个查询条件时,mongdb尝试合并这些查询条件的区间范围来计算出更小的范围区间,来获得更快的查询速度并减少资源利用。

使用多键索引的边界交集来查询

边界交集代表多个边界相互重合的点。如有两个区间[3, 无穷大]和[无穷小,6],这两个区间的交集就是[3,6]。Mongodb将这种求交集的方式,应用到数据查询当中。有一个构建了索引的数组字段,当使用$elemMatch指定多个查询条件查询数据时,Mongodb会将查询条件合并。下边的例子,说明了这种查询优化方法。

构建结合students并插入数据

db.students.insertMany([
    {_id: 1, name: 'Shawn', grades: [70,85]},
    {_id: 2, name: 'Elena', grades: [92, 84]}
])

为数组创建多键索引

db.students.createIndex({grades: 1})

构建查询语句

db.students.find( { grades: { $elemMatch: { $gte: 90, $lte:99 } } } )

这个语句中,只要数组中任何一个数据符合大于等于90,小于等于99的数据。

单独分析每个查询条件,第一个边界是[90,无穷大],第二个边界是[无穷小,99],在使用$elemMatch时,mongodb先计算两个边界的交集[90,99]

当不使用$elemMatch时,Mongodb不会先计算边界的交集。

db.students.find( { grades: { $gte: 90, $lte:99 } }  )

该查询会查询出满足下面两个条件的文档

  • 数组grades中至少有一个元素大于等于90
  • 数组grades中至少有一个元素小于等于99

因为没有使用$elemMatch, Mongodb不会计算边界的交集。而是使用两个边界中的任何一个来查找,不能保证使用哪一个条件。

从解释计划当中也能看出来两者查询数据范围的不同

db.students.find( { grades: { $elemMatch: { $gte: 90, $lte:99 } } } ).explain()

db.students.find( { grades: { $gte: 90, $lte:99 } }  ).explain()

下面两张图片中,左边使用了$elemMatch, 右侧没有使用

复合多键索引边界混合

复合边界集合了复合多键索引中的边界。使用复合多键索引的多个字段边界值,能够减少查询时间。Mongodb不需要单独计算每个边界的查询结果。如符合索引{temperature: 1, humidity: 1}有下面的两个边界

  • 温度[80, 无穷大]
  • 湿度[无穷小,20]

则计算出来的复合边界就是

{ temperature: [80, 无穷大], humidity: [无穷小,20]}

如果mongodb不能将这两个边界混合,mongodb只能够使用前面的字段索引来查询数据。在这个例子中,前面的字段是temperature。下面的应用,详细描述了mongodb在复合多键索引中的边界混合。

非数组字段和数组字段的边界混合

这个例子展示了mongodb通过混合边界来定义更高效的查询约束提高性能

构建survey集合并插入数据

db.survey.insertMany([
    { _id: 1, item: "abc", ratings: [ 2, 5, 8 ] },
    { _id: 2, item: "xyz", ratings: [ 5, 8 ] }
])

创建复合多键索引

db.survey.createIndex({item: 1, ratings: 1})

构建查询语句

db.survey.find({item: "abc", ratings: { $gte: 3}})

直接看执行计划,会更清楚一些

该查询使用字段item和数组字段rating进行查找。单独来看么一个查询条件

item字段值是“abc”, mongodb在执行时,转换为边界["abc", "abc"]

rating边界是{$gte: 3},转换为[3,无穷大]

mongodb将两个边界组合进行查询

非数组字段和多个数组字段的边界混合

下面的例子展现了mongodb怎样将非数组字段和多个数组字段的边界混合

构建集合survey2并插入数据

db.survey2.insertMany([
    { _id: 1, item: "abc", ratings: [ { score: 2, by: "mn"}, { score: 9, by: "anon"}] },
    { _id: 2, item: "xyz", ratings: [  { score: 5, by: "anon"}, { score: 7, by: "wv"}] }
])

为集合添加符合多键索引

db.survey2.createIndex({item: 1, "ratings.score": 1, "ratings.by": 1})

构建查询语句

db.surver2.find({item: "xyz", "ratings.score": { $lte: 5}, "ratings.by": "anon"})

单独看每个查询条件

  • item字段的边界 item: "xyz", 转换为[["xyz", "xyz"]]
  • score的边界是{$lte:5},转换为[无穷小, 5],
  • by的边界是 by: "anon",转换为["anon", "anon"]

Mongodb 将item的边界和ratings.score或ratings.by当中的一个边界混合,取决于查询操作符和索引值。当mongodb不能确认使用哪个边界来进行混合。执行计划也无法确定使用哪个索引来进行查询。

为了保证mongodb能够将文档数组中的边界混合,必须使用$elemMatch操作符

混合相同数组中多个字段的边界

为了能够混合相同数组中多个字段的索引边界,必须满足下面两个条件

  • 除了字段名称以外,索引键必须在相同的路径上
  • 查询语句必须使用$elemMatch查询相同路径上的值

在嵌入式文档数组中,使用点操作符的字段名称,如“a.b.c.d”, 就是字段d的字段路径。为了能够混合相同数组中的多个边界,$elemMatch必须在这个路径上,并且不包含字段本身。如“a.b.c”

在前面创建的集合survey2中添加索引

db.surver2.createIndex({"ratings.score": 1, "ratings.by": 1})

构建查询语句, 使用$elemMatch操作符查询ratings字段,查询出满足两个条件的数据。

db.surver2.find({ratings: {$elemMatch: {score: {$lte: 5}, by: "anon"}}})

看查询计划,能够看到mongodb混合了两个边界为一个边界


http://www.niftyadmin.cn/n/5558001.html

相关文章

Chromium CI/CD 之Jenkins实用指南2024- 发送任务到Ubuntu(五)

1. 引言 在前一篇《Chromium CI/CD 之 Jenkins - 创建任务(四)》中,我们详细介绍了如何在Jenkins中创建和配置新任务,包括设置任务名称、选择运行节点、配置触发器、编写执行脚本以及添加文件收集步骤。通过这些步骤,…

【Mamba】Mamba的部署

ubuntu系统安装11.6版本的cuda 可以参考这两篇博客 ubuntu22.04多版本安装cuda及快速切换(cuda11.1和11.8)_ubuntu调整cuda版本 【Linux】在一台机器上同时安装多个版本的CUDA(切换CUDA版本)_linux安装多个cuda 安装CUDA https…

防火墙-NAT策略和智能选路

一、背景技术 在日常网络环境,内部网络想要访问外网无法直接进行通信,这时候就需要进行NAT地址转换,而在防火墙上配置NAT和路由器上有点小区别,思路基本一致,这次主要就以防火防火墙配置NAT策略为例,防火墙…

神经网络类型

卷积神经网络 卷积神经网络的概述 一种带有卷积结构的深度神经网络,通过特征提取和分类识别完成对输入数据的判别 卷积神经网络的层级结构 输入层即接收数据的输入,可以处理多维数据,也能对输入特征进行标准化处理,有利于提升…

前后端工作重点小结

前端和后端的区分 前端(Frontend) 和 后端(Backend) 是 Web 开发中的两个主要部分,它们有不同的职责和技术栈。 前端(Frontend) 职责:负责用户界面的呈现和用户交互。主要语言&am…

【瑞吉外卖 | day07】移动端菜品展示、购物车、下单

文章目录 瑞吉外卖 — day71. 导入用户地址簿相关功能代码1.1 需求分析1.2 数据模型1.3 代码开发 2. 菜品展示2.1 需求分析2.2 代码开发 3. 购物车3.1 需求分析3.2 数据模型3.3 代码开发 4. 下单4.1 需求分析4.2 数据模型4.3 代码开发 瑞吉外卖 — day7 移动端相关业务功能 —…

深度解析:disableHostCheck: true引发的安全迷局与解决之道

在Web开发的浩瀚星空中,开发者们时常会遇到各种配置与调优的挑战,其中disableHostCheck: true这一选项,在提升开发效率的同时,也悄然埋下了安全隐患的伏笔。本文将深入探讨这一配置背后的原理、为何会引发报错,以及如何…

vue仿甘特图开发工程施工进度表

前言 本文是根据项目实际开发中一个需求开发的demo,仅用了elementUI,可当作独立组件使用,C V即用。 当然没考虑其他的扩展性和一些数据的校验,主要是提供一个处理思路,有需要的小伙伴可以直接复制;本demo的…