MongoDB聚合(aggregate)[通俗易懂]

MongoDB聚合(aggregate)[通俗易懂]https://www.cnblogs.com/wt7018/p/11929359.html MongoDB聚合(aggregate) 一、基础 1、什么是聚合? 聚合是基于数据处理的聚合管道,每个文

MongoDB聚合(aggregate)

 

https://www.cnblogs.com/wt7018/p/11929359.html

MongoDB聚合(aggregate)

 

一、基础

1、什么是聚合?

聚合是基于数据处理的聚合管道,每个文档通过一个有多个阶段(stage)组成的管道
可以对每个阶段的管道进行分组、过滤等功能,然后经过一系列的处理,输出相应的结果

db.集合名称.aggregate({管道: {表达式}})

代码100分

有点像Django中ORM聚合的语法

2、常用管道

复制代码
代码100分$group: 将集合中的文档分组,用于统计结果
$match: 过滤数据,只输出符合条件的文档
$project: 修改输入文档的结构,如重命名、增加、删除字段、创建计算结果

$sort: 将输入文档排序后输出
$limit: 限制聚合管道返回的文档数
$skip: 跳过指定数量的文档,并返回余下的文档
$unwind(): 将列表(数组)类型的字段进行拆分
复制代码

3、常用表达式

复制代码
处理输入文档,并输出
语法: 表达式:"$列名"
常用表达式
$sum: 计算总和, $sum:1 表示以一倍计数
$avg: 计数平均值
$min: 获取最小值
$max: 获取最大值
$push: 在结果文档中插入值到一个数组中
$first: 根据资源文档的排序获取第一个文档数据
$last: 根据资源文档的排序获取最后一个文档数据
复制代码

二、常用管道用法

1、$group

复制代码
代码100分作用: 将集合中的文档分组,可用于统计结果
_id表示分组的依据,使用某个字段的格式为"$字段"
格式
db.集合名称.aggregate({$group:{ _id: "$字段", 自定义字段: {表达式: "$字段"}}})

db.stu.aggregate({$group: {_id: "$gender"}})
db.stu.aggregate({$group: {_id: "$gender", count: {$sum: 1}}})
db.stu.aggregate({$group: {_id: "$gender", avg_age: {$avg: "$age"}}})
db.stu.aggregate({$group: {_id: "$hometown", min_age: {$min: "$age"}, count: {$sum: 1}}})

注意: 
    _id后面的值,表示按照什么分组,格式"$字段"
    count, avg_count是自定义的字段
    表达式的值是"$字段"
复制代码

Group by null

将集合中所用文档分为一组,即该集合就是一个组
# 求学生的总量和平均年龄
db.stu.aggregate({$group: {_id: null, count:{$sum: 1}, avg_age:{$avg: "$age"}}})

补充

复制代码
# 插入数据

db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "b"})
db.test.insert({country: "china", province: "sh", userid: "a"})
db.test.insert({country: "china", province: "sh", userid: "c"})
db.test.insert({country: "china", province: "bj", userid: "da"})
db.test.insert({country: "china", province: "bj", userid: "fa"})

# 1.去重
能够同时按照多个键进行分组,若文档中的每个字段都进行分组,那么可以实现去重的功能
db.test.aggregate({$group: {_id: {country: "$country", province: "$province"}}})
# 2.取字典嵌套的字典中的值 
_id: {contry: "$_id.country"}
例子
db.test.aggregate(
{$group: {_id: {country: "$country", province: "$province", userid: "$userid"}}},  
{$group: {_id: {country: "$_id.country", province: "$_id.province"}, count: {$sum: 1}}}, 
{$project: {country: "$_id.country", province: "$_id.province", count: "$count", _id: 0}}
)
复制代码

2、$project

复制代码
作用:修改输入文档的结构,如重命名、增加(显示)、删除(隐藏)字段,创建计算结果
1.显示和隐藏
格式: 
db.集合名称.aggregate({$project: {_id: 0, 字段:1}})
值为0,是隐藏
值为1,是显示
示例
db.stu.aggregate({$project: {_id: 0, name: 1, hometown: 1, age: 1, gender: 1}})
注意: 显示、隐藏字段和投影差不多
2.重命名
例子
db.stu.aggregate({$group: {_id: "$gender", count: {$sum: 1}, avg: {$avg: "$age"}}}, {$project: {_id: 0,gender: "$_id", counter: "$count", avg_age: "$avg"}})
注意: 
重命名字段格式 {新的字段名: "$旧的字段名称"}
管道符之间用逗号隔
复制代码

3、$match

复制代码
作用: 用于过滤数据,只输出符合条件的文档
注意: match是管道命令,能将结果交给下一个管道,find不可以
例子
db.stu.aggregate({$match: {age: {$lte: 18}}})
# 过滤->分组->重命名、显示
db.stu.aggregate({$match: {age: {$lte: 18}}}, {$group: {_id: "$gender", count: {$sum: 1}}}, {$project: {gender: "$_id", _id: 0, count: 1}})
复制代码

 4、$limit和$skip

复制代码
$limit
限制聚合管道返回的文档数
例子
db.stu.aggregate({$limit: 2})

$skip
跳过指定数量的聚合管道文档。并返回剩下的文档
例子
db.stu.aggregate({$skip: 2})
db.stu.aggregate({$limit: 2}, {$skip: 3})
注意顺序:先写skip,再写limit
复制代码

5、$unwind

复制代码
# unwind 解开,松开
作用: 将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值
格式:
db.集合名称.aggregate({$unwind: "$字段名称"})
例子
db.t2.insert({_id: 1, item:"t-shirt", size: ["S", "M", "L"]})
db.t2.aggregate({$unwind: "$size"})
结果:
{ "_id" : 1, "item" : "t-shirt", "size" : "S" }
{ "_id" : 1, "item" : "t-shirt", "size" : "M" }
{ "_id" : 1, "item" : "t-shirt", "size" : "L" }

# 补充

db.集合名称.aggregate({
    $unwind: {
        path: "$字段名称",
        preserveNullAndEmptyArrays: <boolean>  # 防止数据丢失
    }
})
属性preserveNullAndEmptyArrays值
为false表示抛弃属性值为空的文档
为true表示保留属性值为空的文档

例子
db.t3.aggregate({$unwind: {path: "$size", preserveNullAndEmptyArrays: false}})

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/9187.html

(0)
上一篇 2023-02-13
下一篇 2023-02-13

相关推荐

  • 数据库中间件DBLE学习(一) 基础介绍和快速搭建

    数据库中间件DBLE学习(一) 基础介绍和快速搭建dble基本架构简介 dble是 基于 的高可用扩展性的分布式中间件。江湖人送外号 。 "开源地址" 我们首先来看架构图,外部应用通过NIO/AIO进行连接操作。这里首先我们得介绍

    2022-12-28
    114
  • 刨根问底,完美解决Django2版本连接MySQL报错的问题「建议收藏」

    刨根问底,完美解决Django2版本连接MySQL报错的问题「建议收藏」引子 关于Django2版本连接MySQL发生的问题以及修改源码的解决方法参考下面这篇文章: Django与MySQL的交互 但是,上面这种修改源码的方法在生产环境中使用的话会有很多问题。 本文为大家

    2023-02-19
    96
  • Python Tkinter实现自定义字体风格

    Python Tkinter实现自定义字体风格随着人们审美观念的不断迭代更新,对字体风格的需求也越来越多样化。Python Tkinter作为一个兼具简洁和高效的GUI库,为用户提供了自定义字体风格的API接口。通过使用Tkinter库,Python开发工程师可以轻松实现自定义字体风格,为用户提供更多样的视觉选择。本文将从多个方面对Python Tkinter实现自定义字体风格进行详细的阐述。

    2023-12-08
    62
  • 数据库 数仓_数仓是什么

    数据库 数仓_数仓是什么摘要:通常在运维监控出现CPU使用率较高、P80/P95指标较高、慢SQL数量上升等现象,或者业务出现超时报错时,优先应排查是否出现慢SQL。 本文分享自华为云社区《GaussDB慢SQL常见定位处理

    2023-06-12
    98
  • mysql删除日志文件,定时清理日志会怎么样_redis日志清理

    mysql删除日志文件,定时清理日志会怎么样_redis日志清理今天发现网站不能正常访问,于是登陆服务器查找问题。 机智的我随手用命令:df -l 发现 硬盘爆满了,于是就知道问题所在了。 Filesystem 1K-blocks Used Available …

    2023-03-05
    103
  • oracle使用索引_oracle 索引查询

    oracle使用索引_oracle 索引查询第四章索引和事务 1. 什么是索引?有什么用? 1)索引是数据库对象之一,用于加快数据的检索,类似于书籍的目录。在数据库中索引可以减少数据库程序查询结果时需要读取的数据量,类似于在书籍中我们利用索引可

    2023-02-05
    110
  • 包含用python实现因子分析的词条

    包含用python实现因子分析的词条 一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点黑客技术,既可以节省时间,还可能挽救“生命”。

    2023-10-30
    77
  • Python面向对象编程Class的应用场景

    Python面向对象编程Class的应用场景面向对象编程(Object-Oriented Programming, OOP) 是一种编程范式,它使用基于对象的方式来组织代码。Python 的面向对象编程可以使用 Class 来实现。Class 是 Python 中面向对象编程的核心,它可以实现面向对象编程中的封装、继承和多态等特性。

    2023-12-15
    62

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注