100% 展示 MySQL 语句执行的神器-Optimizer Trace[通俗易懂]

100% 展示 MySQL 语句执行的神器-Optimizer Trace[通俗易懂]在上一篇文章《用Explain 命令分析 MySQL 的 SQL 执行》中,我们讲解了 Explain 命令的详细使用。但是它只能展示 SQL 语句的执行计划,无法展示为什么一些其他的执行计划未被选…

100% 展示 MySQL 语句执行的神器-Optimizer Trace

在上一篇文章《用Explain 命令分析 MySQL 的 SQL 执行》中,我们讲解了 Explain 命令的详细使用。但是它只能展示 SQL 语句的执行计划,无法展示为什么一些其他的执行计划未被选择,比如说明明有索引,但是为什么查询时未使用索引等。为此,MySQL 提供了 Optimizer Trace 功能,让我们能更加详细的了解 SQL 语句执行的所有分析,优化和选择过程。

如果您想更深入地了解为什么选择某个查询计划,那么优化器跟踪非常有用。虽然 EXPLAIN 显示选定的计划,但Optimizer Trace 能显示为什么选择计划:您将能够看到替代计划,估计成本以及做出的决策。本篇文章会详细讲解 Optimizer Trace 展示的所有相关信息,并且会辅之一些具体使用案例。

基于成本的执行计划

在了解 Optimizer Trace 的之前,我们先来学习一下 MySQL 是如何选择众多执行计划的。

MySQL 会使用一个基于成本(cost)的优化器对执行计划进行选择。每个执行计划的成本大致反应了该计划查询所需要的资源,主要因素是计算查询时将要访问的行数。优化器主要根据从存储引擎获取数据的统计数据和数据字典中元数据信息来做出判断。它会决定是使用全表扫描或者使用某一个索引进行扫描,也会决定表 join的顺序。优化器的作用如下图所示。

image

优化器会为每个操作标上成本,这些成本的基准单位或最小值是从磁盘读取随机数据页的成本,其他操作的成本都是它的倍数。所以优化器可以根据每个执行计划的所有操作为其计算出总的成本,然后从众多执行计划中,选取成本最小的来最终执行。

既然是基于统计数据来进行标记成本,就总会有样本无法正确反映整体的情况,这也是 MySQL 优化器有时做出错误优化的重要原因之一。

Optimizer Trace 的基本使用

首先,我们来看一下具体如何使用 Optimizer Trace。默认情况下,该功能是关闭的,大家可以使用如下方式打开该功能,然后执行自己需要分析的 SQL 语句,然后再从 INFORMATION_SCHEMA 的 OPTIMIZER_TRACE中查找到该 SQL 语句执行优化的相关信息。

# 1. 打开optimizer trace功能 (默认情况下它是关闭的):
SET optimizer_trace="enabled=on";
SELECT ...; # 这里输入你自己的查询语句
SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;
# 当你停止查看语句的优化过程时,把optimizer trace功能关闭
SET optimizer_trace="enabled=off";

代码100分

这个 OPTIMIZER_TRACE 表有4个列,如下所示:

  • QUERY:表示我们的查询语句。
  • TRACE:表示优化过程的JSON格式文本。
  • MISSING_BYTES_BEYOND_MAX_MEM_SIZE:由于优化过程可能会输出很多,如果超过某个限制时,多余的文本将不会被显示,这个字段展示了被忽略的文本字节数。
  • INSUFFICIENT_PRIVILEGES:表示是否没有权限查看优化过程,默认值是0,只有某些特殊情况下才会是1,我们暂时不关心这个字段的值。

其中,信息最多也最为重要的就是第二列 TRACE,它也是我们后续分析的重点。

TRACE 列的基本格式

TRACE 列的内容是一个超级大的 JSON 数据,直接展开然后一条一条解析估计能看到大伙脑壳疼。

image

所以,我们先来看一下这坨大 JSON 的骨架。它有三大块内容,也代表着 SQL 语句处理的三个阶段,分别为准备阶段,优化阶段和执行阶段。

image

接下来,我们详细介绍一个案例,在案例中介绍涉及到的具体字段和含义。

为什么查询未走索引而是全表扫描

首先,SQL 语句查询不使用索引的情况有很多,我们这里只讨论因为基于成本的优化器认为全表查询执行计划的成本低于走索引执行计划的情况。

如下图这个场景,明明 val 列上有索引,并且 val 现存值也有一定差异性,为什么没有使用索引进行查询呢?

image

我们按照上文使用 Optimizer Trace 找到其 join_optimization 中 range_analysis 相关数据,它会展示 where 从句范围查询过程中索引的选择情况

image

由上图可以看出,MySQL 对比了全表扫描和使用 val 作为索引两个方案的成本,最后发现虽然全表扫描需要扫描更多的行,但是成本更低。所以选择了全表扫描的执行方案。

这是为什么呢?明明使用 val 索引可以少扫描 4 行。这其实涉及 InnoDB 中使用索引查询数据行的原理。

Innodb引擎查询记录时在无法使用索引覆盖(也就是需要查询的数据多与索引值,比如该例子中,我要查name,而索引列是 val)的场景下,需要做回表操作获取记录的所需字段,也就是说,通过索引查出主键,再去查数据行,取出对应的列,这样势必是会多花费成本的。

所以在回表数据量比较大时,经常会出现 Mysql 对回表操作查询代价预估代价过大而导致不使用索引的情况。

一般来说,当SQL 语句查询超过表中超过大概五分之一的记录且不能使用覆盖索引时,会出现索引的回表代价太大而选择全表扫描的现象。且这个比例随着单行记录的字节大小的增加而略微增大。

通过 range_analysis 中的相关数据也可以对 where 从句使用多个索引列,如何选择执行时使用的索引的情况进行分析。

小节

终于,介绍了有关于 MySQL 语句执行分析的 explain 和 Optimizer Trace,下一篇,我们将分析具体的死锁场景。

个人博客,欢迎来玩

image

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/6898.html

(0)
上一篇 2023-03-31 12:30
下一篇 2023-03-31

相关推荐

  • Python 在编程中的作用

    Python 在编程中的作用Python 是一种高级编程语言,采用面向对象的编程思想,最初由 Guido van Rossum 于 1991 年开发。Python 具有简洁、易读、易学的特点,因此被广泛应用于各类编程领域,如 Web 开发、数据科学、机器学习等等。Python 具备编写底层系统代码和高层应用代码的能力,被誉为全能编程语言。本文将从多个方面阐述 Python 在编程中的作用。

    2024-06-12
    53
  • Python参数定义的完整指南

    Python参数定义的完整指南在Python编程中,参数(也称为参数变量)是用于传递值或引用的特殊变量。在函数、方法和类的定义中,参数具有不同的类型和用途,以支持更复杂的编程逻辑。在本文中,我们将深入了解Python中的各种参数类型,并为您提供实用示例,使您能够更好地理解和应用它们。

    2024-04-05
    76
  • 如何使用Python的os.makedirs()递归创建目录结构?

    如何使用Python的os.makedirs()递归创建目录结构?Python的os模块提供了一系列与操作系统交互的函数和变量,其中os.makedirs()函数可以用于创建递归的多级目录结构。

    2024-03-21
    78
  • [20191119]探究ipcs命令输出2.txt

    [20191119]探究ipcs命令输出2.txt[20191119]探究ipcs命令输出2.txt–//继续上午的测试:http://blog.itpub.net/267265/viewspace-2664758/=>[20191119]探

    2022-12-19
    125
  • 502 bad gateway什么原因_502 bad gateway手机

    502 bad gateway什么原因_502 bad gateway手机

    2023-04-19
    167
  • sql怎么优化查询效率_sqlserver千万级数据查询

    sql怎么优化查询效率_sqlserver千万级数据查询有一张财务流水表,未分库分表,目前的数据量为9555695,分页查询使用到了limit,优化之前的查询耗时16 s 938 ms (execution: 16 s 831 ms, fetching:…

    2023-03-29
    153
  • 利用RadonDB实现MySQL分库分表

    利用RadonDB实现MySQL分库分表利用RadonDB实现MySQL分库分表 RadonDB是青云上提供的MySQL分布式解决方案,提供数据库的透明拆分及高可用服务。RadonDB包括Radon, Xenon, MySQL三部分安装。…

    2023-02-08
    149
  • Python词频统计代码

    Python词频统计代码在大量文本数据中,关键词的频次统计往往是必不可少的。无论是从市场营销角度还是从学术角度,词频统计都占有重要的地位。而Python作为一种擅长文本处理的编程语言,提供了一种快速而准确的词频统计方法。

    2024-06-29
    44

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注