mongodb入门教程_mongoDB

mongodb入门教程_mongoDB简单了解 MongoDB 的基本概念之后,就需要了解其提供的一些工具和数据逻辑结构,以真正开始入门 MongoDB 的学习。

MongoDB - 入门指南

组件结构

核心进程

在 MongoDB 中,核心进程主要包含了 mongod、mongos 和 mongosh 三个。

其中最主要的是 mongod 程序,其在不同的部署方案中(单机部署、副本集部署、分片集群部署),通过不同的配置,可以扮演多种不同的角色:

  • 在单机部署中作为数据库服务器(提供所有读写功能)
  • 在副本集部署中,通过配置,可以部署为 Primary 节点(负责写数据,也可以提供查询)、Secondary 节点(从主节点复制数据,也可以提供查询)、以及 Arbiter 节点(不保存数据,主要用于参与选举投票)
  • 在分片集群中,除了在每个分片中扮演上述角色外,还扮演着配置服务器的角色(存储有分片集群的所有元数据信息,mongos 的数据路由分发等都要依赖于它)

在一台服务器上,可以启动多个 mongod 服务。但在实际生产部署中,通常是建议一台服务器部署一个 mongod 实例,这样不仅减少资源竞争,而且服务器故障也不会同时影响到多个服务。

mongos 在分片集群中扮演路由的角色,提供客户端和分片之间的接口。

mongosh 是 MongoDB 集成的交互式 shell 工具。

数据库工具

MongoDB 数据库工具是用于处理 MongoDB 部署的命令行实用程序的集合。数据库工具包括以下二进制文件:

  • 二进制导入导出
    • mongodump: 导出 mongod 数据库的二进制数据
    • mongorestore: 恢复 mongodump 导出文件的数据到 mongod 或 mongos 数据库
    • bsondump: 转换 BSON 导出文件成 JSON 格式
  • 数据导入导出
    • mongoimport: 从外部 JSON、CSV 或 TSV 文件中加载数据
    • mongoexport: 从 mongod 实例中导出数据到 JSON 或 CSV 文件中
  • 诊断工具
    • mongostat: 快速诊断当前运行的 mongod 或 mongos 实例的状态
    • mongotop: 统计 mongod 实例读取和写入数据的时间
  • GridFS 工具
    • mongofiles: 支持在 GridFS 对象中操作 MongoDB 实例中存储的文件

数据逻辑结构

MongoDB 数据逻辑结构分为数据库 database、集合 collection、文档 document 三层 :

  • 一个 mongod 实例中允许创建多个数据库
  • 一个数据库中允许创建多个集合,集合相当于关系型数据库的表
  • 一个集合则是由若干个文档构成,文档相当于关系型数据库的行,是 MongoDB 中数据的基本单元

数据库

一个数据库中可以创建多个集合,原则上应把逻辑相近的集合都放在一个数据库中。

在 MongoDB 中,会有以下几个内建的数据库:

  • admin: 存放有数据库帐号相关信息,在身份验证和授权时使用
  • local: 特定于单个服务器的数据会存储在此数据库中。在副本集中,local 数据库用于存储复制过程中所使用的数据,而其本身不会被复制。
  • config: 用于分片集群环境,存放了分片相关的元数据信息
  • test: 默认创建的测试库,连接 mongod 服务时,如果不指定连接的具体数据库,默认就会连接到 test 数据库

集合

和 SQL 的表不同,集合是动态模式,不需要在读写数据前创建模式就可以使用,集合中的文档也可以拥有不同的字段,随时可以任意增减某个文档的字段。

默认情况下,集合不要求其文档具有相同的模式,但这是一种很好的实践。可以通过使用 MongoDB 的文档验证功能和可用于多种编程语言的对象–文档映射(object-document mapping)库来实现文档验证。

集合由其名称进行标识,集合名称可以是任意 UTF-8 字符串,但有以下限制:

  • 不能是空字符串("")。
  • 不能含有 (空字符),这个字符用于表示集合名称的结束
  • 不能以 system. 开头,该前缀为内部集合保留

集合名称使用 . 字符可以创建子集合,用与区分不同组织集合。虽然子集合没有任何特殊属性,但它们很有用,许多 MongoDB 工具整合了子集合。

文档

文档是 MongoDB 中数据的基本存储单元,以一种叫作 BSON 的文档结构表示。

文档中的键值对是有序的,不同序则是不同文档。并且键是区分大小写的,否则也为不同文档。

文档的键是字符串,而值除了字符串,还可以是 IntLongDoubleBoolean、数组、嵌入文档等多种类型。

每个文档都有一个默认的 _id 键,它相当于关系型数据库中的主键,这个键的值在同一个集合中必须是唯一的。

_id 键的值默认是 ObjectId 类型,在插入文档的时候,如果用户不设置文档的 _id 值的话,MongoDB 会自动生成一个唯一的 ObjectId 值进行填充。

数据库文件

MongoDB 在 3.2 版本已经将 WiredTiger 作为默认的存储引擎。其作为存储引擎的时候,数据库会有以下存储文件:

  • collection-*.wt: 存储集合的数据
  • index-*.wt: 存储索引的数据
  • WiredTiger: 存储基本配置信息
  • WiredTiger.wt: 存储所有其他集合的元数据信息
  • WiredTiger.lock: 存储进程 ID,用于防止多个进程连接同一个 WiredTiger 数据库
  • WiredTiger.turtle: 存储 WiredTiger.wt 的元数据信息
  • journal: 存储数据库的写日志

命令行工具

MongoDB 提供的 mongosh 是一个 JavaScript 的 shell,其提供了许多高级功能和自定义功能。

使用技巧

对于 MongoDB 提供的功能,shell 内置了帮助文档,可以输入 help 命令进行访问,使用 db.help() 可以查看数据库级别的帮助文档,使用 db.foo.help() 可以查看集合级别的帮助文档。

在 shell 中使用函数之前,在不使用括号的情况下输入函数名,这样会打印出函数的源代码,这是一个可以查看函数具体行为的好方法。

执行脚本

shell 不止可以直接执行 JavaScript 的脚本代码,还可以用于执行 JavaScript 的脚本文件,简单执行 mongo script.js 即可。

如果已经进入到 shell 中,可以使用 load() 函数加载 JavaScript 脚本文件。

创建 .mongorc.js 文件

对于需要频繁被加载的脚本,可以将它们添加到 .mongorc.js 中,此文件会在启动 shell 时自动运行。

在更实际一些的场景中,使用此脚本可以设置全局变量,或者为长名称设置一个简短的别名,也可以重写内置函数。

定制提示信息

通过将 prompt 变量设置为一个字符串或函数,可以重写默认的 shell 提示,如下示例:

prompt = function() {
    if (typeof db == "undefined") {
        return "(nodb)> ";
    }

    // 检查最后的数据库操作
    try {
        db.runCommand({getLastError: 1});
    } catch (e) {
        print(e);
    }

    return db+"> ";
};

提示函数应该返回一个字符串,通常应该包含对 getLastError 的调用,这样可以捕获输入时的错误,并在 shell 断开连接时自动重新连接。

编辑复杂变量

使用 shell 时,编辑多行的时候不能再编辑前面的行,这对于较大的代码块或对象非常不友好。

为此,可以在 shell 中设置 EDITOR 变量,则可以使用 edit varname 的方式编辑一个变量,完成更改后只需保存并退出编辑器,变量将被重新解析并加载回 shell 中。

不便使用的集合名称

大多数情况下可以使用 db.collectionName 语法来获得一个集合的内容,但如果集合名称是保留字或是无效的 JavaScript 属性名称时,那么此方法就不能正常工作了。

对于上述的情况,可以使用 db.getCollection() 的方式绕过无效属性。

原文地址:https://www.cnblogs.com/fatedeity/archive/2022/11/14/16887933.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/4545.html

(0)
上一篇 2023-06-15
下一篇 2023-06-15

相关推荐

  • Hadoop介绍[亲测有效]

    Hadoop介绍[亲测有效]Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台,允许使用简单的编程模型在大量的计算机集群上对大型数据集进行分布式处理。 下面是Hadoop

    2023-03-15
    147
  • 如何应对PS容差问题

    如何应对PS容差问题Photoshop是一个强大的图像编辑软件,用于进行各种图像处理和设计任务。在处理图像时,容差问题是一个常见的问题。如果您不知道如何处理容差问题,可能会导致图像质量下降,可能会对您的设计和制作工作产生不利影响。

    2024-06-13
    47
  • Python中的next函数:迭代器中获取下一个元素

    Python中的next函数:迭代器中获取下一个元素在Python中,可以使用迭代器(Iterator)以及生成器(Generator)实现对数据的遍历操作。在遍历的过程中,我们可能需要获取当前元素的下一个元素,这时候就需要使用到Python内置的next函数。

    2024-01-02
    112
  • 电脑系统重装后没有声音怎么办[亲测有效]

    电脑系统重装后没有声音怎么办[亲测有效]电脑系统重装后没有声音怎么办,下面与大家分享下系统重装后没有声音怎么解决的教程。 1第一步鼠标右键单击此电脑,选择管理进入页面,单击设备管理器,展开声音、视频和游戏控制器,查看设备是否有问号,如果有…

    2023-04-10
    161
  • 使用Python的PyMax模块进行数据处理和分析

    使用Python的PyMax模块进行数据处理和分析PyMax是Python中用于数据处理和分析的一个强大模块。它具有丰富的统计方法、数据可视化等功能,能够满足数据分析的多种需求。

    2024-02-25
    136
  • mysql流程控制语句包括哪些_算法基本控制结构

    mysql流程控制语句包括哪些_算法基本控制结构一、分支结构 #1.if 函数 语法:if(条件 , 值1,值2) 功能:实现双分支 应用在begin end中或外面 #2.case 结构 语法: 情况1:类似于switch case 变量或表达…

    2023-03-31
    158
  • Python展示当前时间

    Python展示当前时间Python是一种简单易学的编程语言,并且拥有广泛的应用领域。在Python中,展示当前时间是一种极其常见的操作,也可以作为入门级别的练手小程序。展示当前时间代码简单易懂,容易传达给读者。

    2024-07-24
    42
  • Flink 流式聚合性能调优指南[亲测有效]

    Flink 流式聚合性能调优指南[亲测有效]原文:Flink 流式聚合性能调优指南 SQL 是数据分析中使用最广泛的语言。Flink Table API 和 SQL 使用户能够以更少的时间和精力定义高效的流分析应用程序。此外,Flink Tab

    2023-03-05
    123

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注