面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]01 前言 哈喽,好久没更新啦。因为最近在面试。用了两周时间准备,在 3 天之内拿了 5 个 offer,最后选择了广州某互联网行业独角兽 offer,昨天刚入职。这几天刚好整理下在面试中被问到有意思

01 前言

哈喽,好久没更新啦。因为最近在面试。用了两周时间准备,在 3 天之内拿了 5 个 offer,最后选择了广州某互联网行业独角兽 offer,昨天刚入职。这几天刚好整理下在面试中被问到有意思的问题,也借此机会跟大家分享下。

这家企业的面试官有点意思,一面是个同龄小哥,一起聊了两个小时(聊到我嘴都干了)。他问了我一个有意(keng)思(b)问题:

数据库中的自增 ID 用完了该怎么办?

这个问题其实可以分为有主键 & 无主键两种情况回答。

国际惯例,先上张脑图:

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

1.1 往期精彩

MySQL 查询语句是怎么执行的?

MySQL 索引

MySQL 日志

MySQL 事务与 MVCC

MySQL 的锁机制

MySQL 字符串怎么设计索引?

02 有主键

如果你的表有主键,并且把主键设置为自增。

在 MySQL 中,一般会把主键设置成 int 型。而 MySQL 中 int 型占用 4 个字节,作为有符号位的话范围就是 [-2^31,2^31-1],也就是[-2147483648,2147483647];无符号位的话最大值就是 2^32-1,也就是 4294967295。

下面以有符号位创建一张表:

CREATE TABLE IF NOT EXISTS `t`(
   `id` INT(11) NOT NULL AUTO_INCREMENT,
   `url` VARCHAR(64) NOT NULL,
   PRIMARY KEY ( `id` )
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

插入一个 id 为最大值 2147483647 的值,如下图所示:

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

如果此时继续下面的插入语句:

INSERT INTO t (url) VALUES ('wwww.javafish.top/article/erwt/spring')

结果就会造成主键冲突:

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

2.1 解决方案

虽说 int 4 个字节,最大数据量能存储 21 亿。你可能会觉得这么大的容量,应该不至于用完。但是互联网时代,每天都产生大量的数据,这是很有可能达到的。

所以,我们的解决方案是:把主键类型改为 bigint,也就是 8 个字节。这样能存储的最大数据量就是 2^64-1,我也数不清有多少了。反正在你有生之年应该是够用的。

PS:单表 21 亿的数据量显然不现实,一般来说数据量达到 500 万就该分表了

03 没主键

另一种情况就是建表时没设置主键。这种情况,InnoDB 会自动帮你创建一个不可见的、长度为 6 字节的 row_id,默认是无符号的,所以最大长度是 2^48-1。

实际上 InnoDB 维护了一个全局的 dictsys.row_id,所以未定义主键的表都共享该 row_id,并不是单表独享。每次插入一条数据,都把全局 row_id 当成主键 id,然后全局 row_id 加 1。

这种情况的数据库自增 ID 用完会发生什么呢?

1、创建一张无显示设置主键的表 t:

CREATE TABLE IF NOT EXISTS `t`(
   `age` int(4) NOT NULL
)ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、通过 ps -ef|grep mysql 命令获取 mysql 的进程 ID,然后执行命令,通过 gdb 先把 row_id 修改为 1。PS:没有 gdb 的,百度安装下

sudo gdb -p 16111 -ex 'p dict_sys->row_id=1' -batch

出现下图就是没错的:

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

3、插入三条数据:

insert into t(age) values(1);
insert into t(age) values(2);
insert into t(age) values(3);

此时的数据库数据:

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

4、gdb 把 row_id 修改为最大值:281474976710656

sudo gdb -p 16111 -ex 'p dict_sys->row_id=281474976710656' -batch

5、再插入三条数据:

insert into t(age) values(4);
insert into t(age) values(5);
insert into t(age) values(6);

此事的数据库数据:

面试官:数据库自增 ID 用完了会咋样?[通俗易懂]

分析:

  • 刚开始设置 row_id 为 1,插入三条数据 1、2、3 的 row_id 也理应是 1、2、3;这是没问题的。

  • 接着设置 row_id 为最大值,紧跟着插入三条数据。这时的数据库结果是:4、5、6、3;你会发现 1、2 被覆盖了。

  • row_id 达到后最大值后插入的值 4、5、6 的 row_id 分别是 0、1、2;由于 row_id 为 1、2 的值已存在,所以后者的值 5、6 会覆盖掉 row_id 为 1、2 的值。

结论:row_id 达到最大值后会从 0 重新开始算;前面插入的数据就会被后插入的数据覆盖,且不会报错。

04 总结

数据库自增主键用完后分两种情况:

  • 有主键,报主键冲突
  • 无主键,InnDB 会自动生成一个全局的row_id。它到达最大值后会从 0 开始算,遇到 row_id 一样时,新数据覆盖旧数据。所以,我们还是尽量给表设置主键

为什么我说这是个有意(keng)思(b)问题?

我的回答除了以上解决方法外,还提到在业务开发中,我们不会等到主键用完那天就已经分库分表了,基本不会遇到这种情况。

这时,面试官可能会问你分库分表咋处理,如果你不会就不要主动提了,点到即止。

05 参考文章

  • blog.csdn.net/weixin_39640090/article/details/113227742
  • blog.csdn.net/qq_35393693/article/details/100059966
  • time.geekbang.org/column/article/69862

06 大厂面试题 & 电子书

如果看到这里,喜欢这篇文章的话,请帮点个好看

初次见面,也不知道送你们啥。干脆就送几百本电子书2021最新面试资料吧。微信搜索JavaFish回复电子书送你 1000+ 本编程电子书;回复面试送点面试题;回复1024送你一套完整的 java 视频教程。

面试题都是有答案的,详细如下所示:有需要的就来拿吧,绝对免费,无套路获取

面试题

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/13208.html

(0)

相关推荐

  • 用Python Tkinter创建用户界面

    用Python Tkinter创建用户界面Python作为一种流行的编程语言,能够应用于多种领域,包括科学计算、web开发以及桌面应用程序等。在本文中,我们将重点关注如何使用Python Tkinter库来创建自己的用户界面。Tkinter是Python的标准GUI库,可以利用它轻松创建各种桌面应用程序,无论是小型工具,还是复杂的应用程序。在本文中,我们将讨论Tkinter库本身的结构以及如何使用该库创建一个简单的应用程序。

    2024-01-12
    106
  • Python命令大全

    Python命令大全Python是一种高级、解释型的编程语言。它有着简单易学、代码量少、执行速度快等优点,在人工智能、数据分析、Web开发等领域都有着广泛的应用。

    2024-07-28
    30
  • Mybatis官方文档解读「终于解决」

    Mybatis官方文档解读「终于解决」作用域(Scope)和生命周期 理解我们之前讨论过的不同作用域和生命周期类别是至关重要的,因为错误的使用会导致非常严重的并发问题。 SqlSessionFactoryBuilder 这个类可以被实例…

    2023-02-09
    163
  • python数据分析快速入门_数据挖掘入门教程

    python数据分析快速入门_数据挖掘入门教程Python环境搭建本次入门系列将使用Python作为开发语言。要使用Python语言,我们先来搭建Python开发平台。我们将基于Python 2.7版本、以及Python的开发发行版本Anacon

    2023-01-24
    156
  • 自然语言处理:让Python更智能的能力

    自然语言处理:让Python更智能的能力自然语言处理(Natural Language Processing,简称NLP)是计算机科学、人工智能和语言学等学科交叉的一门技术。它致力于使计算机能够理解、分析、处理人类语言。在这一过程中,Python已经成为了一种不可或缺的编程语言。Python的简洁性和功能强大的库,如nltk、spaCy和gensim等,使其成为了处理自然语言的首选语言。以下从选取语料、分词、词性标注、命名实体识别、情感分析等方面阐述NLP在Python中实现的方法和技巧。

    2024-02-24
    117
  • 『MySQL』深入理解事务的来龙去脉

    『MySQL』深入理解事务的来龙去脉距离上一篇MySQL的文章已经过去一个月了,终于有时间来写写关于MySQL的事务了。本文内容默认是针对 MySQL InnoDB 引擎。 1. 为什么需要有事务 举一个转账的例子,假设你朋友向你借10000元,你打开APP,乐呵呵的把钱转了,你的卡里已经少了10000元,但是你…

    2023-04-03
    156
  • 基于 Apache Hudi 极致查询优化的探索实践

    基于 Apache Hudi 极致查询优化的探索实践摘要:本文主要介绍 Presto 如何更好的利用 Hudi 的数据布局、索引信息来加速点查性能。 本文分享自华为云社区《华为云基于 Apache Hudi 极致查询优化的探索实践!》,作者:FI_me

    2023-06-07
    148
  • Python 强制类型转化教程

    Python 强制类型转化教程Python作为一门高级语言,其默认情况下都是采用动态类型语言进行编程的。然而,有时候你可能需要在程序中对数据类型进行强制转换。比如说你需要在字符串和整数之间进行加减操作,或者将一个整数转化为一个浮点数。本文将介绍Python的强制类型转化,也称为类型转换。读完本文,你将能够在Python程序中对数据类型进行强制转换,从而更好地控制程序的输出。

    2024-05-04
    65

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注