第02期:MySQL 数据类型的艺术-大对象字段「终于解决」

第02期:MySQL 数据类型的艺术-大对象字段「终于解决」我以前分享过一篇《MySQL 大对象一例》,今天就来详细说下大对象的优缺点以及使用场景。 我们把 MySQL 的大对象类型分 TEXT / BLOB 和 JSON 两部分来说明。 一、TEXT / …

第02期:MySQL 数据类型的艺术-大对象字段

第02期:MySQL 数据类型的艺术-大对象字段「终于解决」

我以前分享过一篇《MySQL 大对象一例》,今天就来详细说下大对象的优缺点以及使用场景。

我们把 MySQL 的大对象类型分 TEXT / BLOB 和 JSON 两部分来说明。

一、TEXT / BLOB 类型

TEXT 和 BLOB 的区别非常简单。TEXT 存储以明文存储,有对应的字符集和校验规则;BLOB 则以二进制存储,没有字符集和排序规则,所有的对比都是以二进制来进行。

示例 1

创建一张表 c1 字段 f1,f2 分别为 tinytext 和 tinyblob。

mysql> create table c1 (f1 tinytext, f2 tinyblob);
Query OK, 0 rows affected (0.03 sec)

代码100分

插入示例数据。

代码100分insert into c1 values ("a","a"),("b","b"),("B","B"),("d","d"),("F","F"),("你","你"),("我","我"),("是吧","是吧");

根据字段 f1 排序。

mysql> select * from c1 order by f1;
+--------+--------+
| f1     | f2     |
+--------+--------+
| a      | a      |
| b      | b      |
| B      | B      |
| d      | d      |
| F      | F      |
| 你     | 你     |
| 我     | 我     |
| 是吧   | 是吧   |
+--------+--------+
8 rows in set (0.01 sec)

根据字段 f2 排序。

代码100分mysql> select * from c1 order by f2;
+--------+--------+
| f1     | f2     |
+--------+--------+
| B      | B      |
| F      | F      |
| a      | a      |
| b      | b      |
| d      | d      |
| 你     | 你     |
| 我     | 我     |
| 是吧   | 是吧   |
+--------+--------+
8 rows in set (0.00 sec)

f1,f2 字段各自排序的结果都不一致。f1 是按照不区分大小写的校验规则,f2 直接二进制检验。

MySQL 的大对象类型,我从以下几类详细说明:

1.1 磁盘空间占用

第02期:MySQL 数据类型的艺术-大对象字段「终于解决」

1.2 表的存储格式

  • 1.2.1 redundant/compact

    对 redundant 格式来说,保存大对象的前 768 字节在 InnoDB 数据页,多出来的放在溢出页。如果有多个 TEXT/BLOB 字段,那数据页将会变得臃肿不堪,性能影响很大。数据页里几乎全是无用的数据,导致额外的资源消耗。同时如果是主从架构,也会把数据全部同步到从机,对网络也是额外的消耗。所以这种场景下,一般都只是保存大对象的路径到数据库,真实的数据则放在磁盘上。

  • 1.2.2 dynamic/compressed

    对 dynamic 格式来说,如果大对象字段存储数据大小小于 40 字节,那全部放在数据页,剩余的场景,数据页只保留一个 20 字节的指针指向溢出页。 这种场景下,如果每个大对象字段保存的数据小于 40 个字节,也就和 varchar(40),效果一样。所以用不用大对象不能一概而论。

1.3 表引擎相关

NDB 引擎不推荐使用大对象。涉及的细节比较多,比如含有大对象的关联字段不支持引擎关联数据下推;含有大对象的表需要额外的加锁等等。

1.4 索引相关

在大对象字段上建立索引必须是前缀,比如字段 f1 为 text,给前 10 个字符建立索引 idx_f1(f1(10))。

mysql> alter table t2 add key idx_f100(f100);
ERROR 1170 (42000): BLOB/TEXT column "f100" used in key specification without a key length

1.5 分区表相关

分区表分区字段不支持大对象。

mysql> create table p1(f1 text) partition by list columns(f1) (partition p0 values in ("1","2"));
ERROR 1502 (HY000): A BLOB field is not allowed in partition function

1.6 参数相关

mysql_allowed_packet,这个参数代表 MySQL 服务端和客户端传输的单次数据包上限,如果有 text/blob 字段,此参数设置为最大值 1GB。当然了,必须同时设置客户端和服务端。

1.7 如何插入/获取

示例 2

插入一个 /var/lib/mysql-files 目录下的所有文件内容。

root@ytt-pc:/var/lib/mysql-files# ll
总用量 32M
1324681  14M -rw-r--r-- 1 root  root   14M 12月 30 17:23 test3
1311598 6.6M -rw-r--r-- 1 root  root  6.6M 12月 30 17:23 test
1316840 6.6M -rw-r--r-- 1 root  root  6.6M 12月 30 17:23 test2
1316693 5.5M -rw-r--r-- 1 root  root  5.4M 12月 30 17:26 random_test
1315066 4.0K -rw-r--r-- 1 root  root  1.9K 12月 30 14:56 sample_y1.txt.nl
1311256 4.0K -rw-r----- 1 mysql mysql 1.7K 12月 30 16:23 y1.txt
1316129 4.0K -rw-r--r-- 1 root  root  1.5K 12月 30 15:28 sample_y1.txt.nl2
1312042 4.0K -rw-r--r-- 1 root  root  1.5K 12月 30 15:07 sample_y1.txt.awk
1316691 4.0K -rw-rw-rw- 1 mysql mysql 1.4K 12月 30 16:25 y1_older.txt
1316168 4.0K -rw-r----- 1 mysql mysql  874 12月 30 14:41 sample_y1.txt
1315893 4.0K -rw-r----- 1 root  root   874 12月 30 14:45 sample_y1.txt.bak
1311076 4.0K -rw-r----- 1 mysql mysql  662 12月 30 13:56 ascii.txt
1312152 4.0K -rw-r--r-- 1 root  root   648 12月 30 14:37 sample.txt
1325161 4.0K -rw-r--r-- 1 root  root   403 12月 31 10:59 y1111.txt.10
1312256 4.0K -rw-r----- 1 mysql mysql  164 12月 31 09:49 y111.txt
1311248 4.0K -rw-r----- 1 mysql mysql  159 12月 31 09:42 y11.txt
1327711 4.0K -rw-r--r-- 1 root  root   126 12月  5 09:56 performance_schema_enable.sql
1326639 4.0K -rw-r--r-- 1 root  root    22 1月  10 11:32 系统名称

存放文件内容的表结构。

mysql-(ytt/3305)->create table file_list_upload_dir(file_name varchar(100) not null primary key,content longtext, updated datetime);
Query OK, 0 rows affected (0.03 sec)

插入文件内容。

root@ytt-pc:/var/lib/mysql-files# for i in $(ls); 
do mysql -uytt -pytt -P3305 -h127.0.0.1  
-e "use ytt;insert into file_list_upload_dir  
values ("$i",load_file("$(pwd)/$i"),now())";done;

二、JSON 类型

JSON 类型相比大家都非常熟悉了,轻量级的文本交互格式,不依赖于任何语句。

制定信息参考: https://tools.ietf.org/html/rfc7159 https://tools.ietf.org/html/rfc7396

JSON 类型在 MySQL 内部以特殊的二进制方式存放,类似于 PostgreSQL 的 JSONB 类型。最大占用空间和 longtext 或者 longblob 一样。text 其实也能存储 JSON 对象,但是没有 JSON 类型的格式校验以及内部提供的众多函数。比如以下例子:

示例 3

变量 @a 和 @b 分别为标准 JSON 格式和非 JSON 格式。创建 json1 表。

mysql-(ytt/3305)->set @a="{"a":1,"b":2,"c":3,"d":4}";
Query OK, 0 rows affected (0.00 sec)

mysql-(ytt/3305)->set @b="{"a":1,"b":2,"c":3,"d":4}";
Query OK, 0 rows affected (0.00 sec)

mysql-(ytt/3305)->create table json1 (str1 json,str2 longtext);
Query OK, 0 rows affected (0.02 sec)

给 str1 插入 @a 成功,@b 失败;str2 任何字符都能插入。

mysql-(ytt/3305)->insert into json1 values (@a,@a);
Query OK, 1 row affected (0.00 sec)

mysql-(ytt/3305)->insert into json1 values (@b,@b);
ERROR 3140 (22032): Invalid JSON text: "Missing a name for object member." at position 1 in value for column "json1.str1".

mysql-(ytt/3305)->insert into json1 values (@a,@b);
Query OK, 1 row affected (0.01 sec)

又比如说检索部分。对 JSON 的检索比对 text 的检索容易太多。还是拿刚才的例子,需要拿出 a 对应的值 1,对 @b 来说,可能比较麻烦,但是换成 @a 就容易多了。json_extract 函数即可。

mysql-(ytt/3305)->select json_extract(@a,"$.a") as "a";
+------+
| a    |
+------+
| 1    |
+------+
1 row in set (0.00 sec)

但是有一点比较幸运的时,针对 @b 这种格式,可以把单个字段拆分为多个,这样就可以利用 SQL 语句简单的检索出结果来了。关于拆或者不拆的优劣暂时不在本篇讨论范围内,将会在表设计理念篇来详细介绍。好了,本篇关于 MySQL 的大对象类型就介绍就到此为止,希望对大家有所帮助。


关于 MySQL 的技术内容,你们还有什么想知道的吗?赶紧留言告诉小编吧!

第02期:MySQL 数据类型的艺术-大对象字段「终于解决」

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/8985.html

(0)
上一篇 2023-02-18
下一篇 2023-02-18

相关推荐

  • Python函数定义与调用

    Python函数定义与调用实现单一的功能或任务,通常可定义一个函数。定义函数时需要使用关键字def,后面跟随函数名和圆括号,括号内可以定义参数。函数的主体部分需要使用冒号和缩进来区分。例如:

    2023-12-27
    64
  • SQL 入门教程:拼接字段「建议收藏」

    SQL 入门教程:拼接字段「建议收藏」目录汇总:SQL 入门教程:面向萌新小白的零基础入门教程 为了说明如何使用 计算字段,我们来举一个简单例子,创建由两列组成的标题。 Vendors 表包含供应商名和地址信息。假如要生成一个供应商报表,

    2023-04-20
    103
  • 数据库用python_数据库结构的基础是

    数据库用python_数据库结构的基础是一、SQL与NoSQL ​ 数据库服务端可以服务多种类型的客户端 ​ 客户端可以是自己开发的,也可以是python代码编写的,也可以是其他编程语言编写的 SQL 操作关系型数据的语言 NoSQL 操作

    2023-06-16
    99
  • IK分词器的安装与使用

    IK分词器的安装与使用分词器 什么是IK分词器? 分词:即把一段中文或者别的划分成一个个的关键字,我们在搜索时会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,Elasticsearch

    2023-03-28
    116
  • apache druid 实时加载kafka 中的数据(一)[通俗易懂]

    apache druid 实时加载kafka 中的数据(一)[通俗易懂]简介 apache druid 是分布式列存储的 OLAP 框架。还是一个时间序列数据库。本篇文章主要是druid 在kafka 加载数据的配置。由于druid 升级情况太快,本人的环境还是在0.1…

    2022-12-19
    102
  • Oracle备份、还原数据库

    Oracle备份、还原数据库备份数据库 创建备份目录(用sys账号),若已创建备份目录,此步可忽略 create directory db_bak as 'D: ECIMS_DB' –查看创建的目录 sele

    2022-12-16
    98
  • 数据库索引b树 b+树_b树索引

    数据库索引b树 b+树_b树索引一、什么是索引 在进行索引之前,我们先提前复习一下数据库的结构 数据库索引,是数据库管理系统中一个排序的数据结构,以协助快速查询、更新数据库表中数据。就像我们以前用的新华字典的目录一样,能帮助我们快…

    2023-03-26
    99
  • Linux安装Redis、后台运行、系统自启动「建议收藏」

    Linux安装Redis、后台运行、系统自启动「建议收藏」Redis是用C语言编写的开源免费的高性能的分布式内存数据库,基于内存运行并支持持久化的NoSQL数据库。 安装 1)从官网http://download.redis.io/releases/下载re

    2023-01-24
    112

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注