工具 | 如何对 MySQL 进行 TPC-C 测试?[通俗易懂]

工具 | 如何对 MySQL 进行 TPC-C 测试?[通俗易懂]作者:丁源 RadonDB 测试负责人 负责 RadonDB 云数据库、容器化数据库的质量性能测试,迭代验证。对包括云数据库以及容器化数据库性能和高可用方案有深入研究。 |背景 根据 DWorks 2

工具 | 如何对 MySQL 进行 TPC-C 测试?

作者:丁源 RadonDB 测试负责人

负责 RadonDB 云数据库、容器化数据库的质量性能测试,迭代验证。对包括云数据库以及容器化数据库性能和高可用方案有深入研究。

|背景

根据 DWorks 2020 年发布的《中国自研数据库登顶 TPC-C 的意义》[1] 报告显示,大于 67.9% 的受访者表示在数据库选型时会参考 TPC-C 的测试结果。对用户来说,性能是数据库选型时最重要的指标之一。而 TPC-C 作为权威的测试基准,是一个能够直观反映软硬件性能的方式。

file

图片来源:2020 DWorks《中国自研数据库登顶 TPC-C 的意义》

|几个概念

一个协会

TPC(事务处理性能协会:Tracsaction Processing Performance Council),是一个大型非盈利的组织。TPC 主要制定了商务应用标准程序(Benchmark)的标准规范,性能和价格度量,并管理测试结果的发布。任何厂家或测试者都可以根据规范,执行标准性能测试。

一个标准

TPC-C 是在线事务处理(OLTP)的基准程序。专门针对联机事务处理系统(OLTP)的性能测试规范,其测试结果可为用户在选择相应解决方案平台时提供参考标准。

一个工具

TPCC-MySQL[2] 是 Percona 基于 TPC-C 衍生出来的标准规范,专门用于 MySQL 基准测试。可运行于 Windows、GNU/Linux、UNIX 以及 Mac OS 系统之上。

一个场景

TPC-C 有一个比较有代表意义的 OLTP 模拟场景:在线订单处理系统

假设有一个大型商品批发商,拥有 N 个位于不同区域的仓库,每个仓库负责为 10 个销售点供货,每个销售点有 3000 个客户,每个客户平均一个订单有 10 项产品。由于一个仓库中不可能 存储公司所有的货物,有一些请求必须发往其它仓库,因此,数据库在逻辑上是分布的。N 是一个可变参数,测试者可以随意改变 N,以获得最佳测试效果。

五类事务

该场景下,TPC-C 规范对应五类事务:

New-Order 客户输入一笔新的订货交易
Payment 更新客户账户余额以反应其支付状况
Delivery 发货(批处理交易)
Order-Status 查询客户最近交易的状态
Stock-Level 查询仓库库存状况,以便能够及时补货

测试完成后会输出这五类事务的吞吐量和延迟,而业内关注的 TPC-C 核心性能指标只有两个:

  • New-Order 事务的吞吐量(TPM)
  • 延迟

其原因是 TPC 委员会制定 TPC-C 时,重点考量的是 数据库对新订单的处理能力,以揭示该数据库的商业成本。数据库整体报价 / TPM = 每个订单的数据库成本。这个指标对衡量一款数据库的性价比,具有非常实际的指导作用。

file

TPC-C 模拟业务场景

接下来将介绍使用 TPC-C 工具模拟业务测试场景。

|环境准备

操作系统:Ubuntu 18.04.5 LTS

容器平台:KubeSphere V3.1.1

数据库:RadonDB MySQL Kubernetes

file

KubeSphere 界面

环境准备完毕,RadonDB MySQL Kubernetes[3] 已经在 KubeSphere[4] 管理界面可见。

创建测试 Pod

kubectl run -i --tty --rm --image ubuntu test-shell bash
kubectl exec -ti test-shell -c test-shell /bin/bash
apt-get update

安装工具

先安装 make、gcc、git 等工具

apt-get install make
apt-get install gcc
apt-get install git

安装测试所需的 MySQL 客户端和开发环境

apt-get install mysql-server
apt-get install libmysqlclient-dev

源码安装 tpcc-mysql

git clone https://github.com/Percona-Lab/tpcc-mysql.git
cd tpcc-mysql/src
make

|数据准备

真实测试场景中,仓库数一般不建议少于 100 个,视服务器硬件配置而定。如果配置了 SSD 或者 PCIE SSD 这种高 IOPS 设备,建议配置仓库数不低于 1000 个。

创建用户

创建用户并授权。

mysql> CREATE USER radondb@localhost IDENTIFIED BY "mysql_password";
Query OK, 0 rows affected (0.00 sec)
 
mysql> grant all privileges on *.* to "radondb"@"%"identified by "mysql_password" with grant option;
Query OK, 0 rows affected, 1 warning (0.01 sec)

创建所需库表

使用 mysqladmin 工具创建测试数据库 tpcc1000。

mysqladmin create  tpcc1000  -h server_host   -u mysql_user -p mysql_password

tpcc-mysql 工具自带前面介绍的测试场景数据表 create_table.sql 文件、索引文件 add_fkey_idx.sql 文件。

mysql -D tpcc1000 -h  server_host  -u mysql_user -p mysql_password < create_table.sql
mysql -D tpcc1000 -h  server_host  -u mysql_user -p mysql_password < add_fkey_idx.sql 

添加数据

使用 tpcc_load 工具,为指定数据库添加数据。

./tpcc_load -h server_host  -d tpcc1000 -u mysql_user -p mysql_password -w 20

|TPC-C 测试

开始测试

执行如下命令,开启一个测试案例。

./tpcc_start -h server_host  -d tpcc1000 -u mysql_user -p mysql_password  -w 20 -c 128 -r 120 -l 200  - >tpcc-output-log

参数说明:

参数 说明
-w 指定仓库数量。
-c 指定并发连接数。
-r 指定开始测试前进行 warmup 的时间,进行预热后,测试效果更好。
-l 指定测试持续时间。
-i 指定生成报告间隔时长。
-f 指定生成的报告文件名。

|测试结果展示

生成图表

安装绘图工具 gnuplot[5],并生成 tcpp.gif 图片。

yum install -y gnuplot
cat log.conf | gnuplot

file

以上就是利用容器 Pod 测试 RadonDB MySQL 数据库全部过程,可以尝试调整测试条件,获得更多测试数据。

|总结

TPC-C 的测试结果主要参考流量和性价比两个指标。

流量

Throughput,简称 tpmC。按照 TPC 的定义,流量指标描述了系统在执行 Payment、Order-status、Delivery、Stock-Level 这四种交易时,每分钟处理 New-Order 交易的数量。所有交易的响应时间必须满足 TPC-C 测试规范的要求。

流量值越大越好!

性价比

Price/Performance,简称 Price/tpmC。即测试系统价格(指在美国的报价)与流量指标的比值。

性价比越小越好!

|参考引用

[1]:《中国自研数据库登顶TPC-C的意义》:https://zhuanlan.zhihu.com/p/114152924

[2]:TPCC-MySQL:https://github.com/Percona-Lab/tpcc-mysql

[3]:RadonDB MySQL Kubernetes:https://github.com/radondb/radondb-mysql-kubernetes

[4]:KubeSphere:https://kubesphere.com.cn

[5]:gnuplot:http://www.gnuplot.info

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/5555.html

(0)
上一篇 2023-05-04
下一篇 2023-05-04

相关推荐

  • Python模块:Numpy计算数组

    Python模块:Numpy计算数组Numpy是Python中功能强大的库之一,它为Python提供了一种更高效的方法来处理大型数​​组和矩阵。Numpy使得Python变得更接近于一种与MATLAB和R等科学计算语言相似的语言,使其在科学计算和数据分析方面更有竞争力。它具有广泛的功能和易于使用的API,允许开发人员更快地进行数值计算。

    2024-03-06
    90
  • 多版本并发控制 MVCC「终于解决」

    多版本并发控制 MVCC「终于解决」本篇文章主要介绍了 多版本并发控制(MVCC)在 MySQL 的实现

    2023-06-05
    140
  • 分享攒了多年的mssql脚本[通俗易懂]

    分享攒了多年的mssql脚本[通俗易懂]分享攒了多年的mssql脚本 脚本类别包括:备份还原表分区常用函数错误日志定时自动抓取耗时SQL并归档发邮件脚本模块镜像批量脚本数据库收缩数据库损坏数据库账号统计数据库大小性能作业 脚本数量:54个

    2023-02-09
    165
  • 容器与k8s_docker仓库搭建

    容器与k8s_docker仓库搭建作者:苏厚镇 青云科技数据库研发工程师 目前从事 RadonDB ClickHouse 相关工作,热衷于研究数据库内核。 ClickHouse[1] 是一款用于联机分析(OLAP)的列式数据库管理系统

    2023-04-20
    164
  • infinispan~介绍

    infinispan~介绍国内的infinispan的文章不多,所以基本都是从google和官方api上找的资料,对一些问题的调研确实花了一些经历,但最终还是解决了问题,心情也是更加愉悦! 介绍 infinispan是分布式的

    2023-04-29
    140
  • 使用Python对应用进行扩展和变更

    使用Python对应用进行扩展和变更随着互联网的发展,越来越多的应用程序需要进行扩展和变更以适应不同的需求。Python是一种流行的编程语言,能够通过其丰富的库、框架和工具,方便地对应用进行扩展和变更。本文将从多个方面介绍如何使用Python来实现应用程序的扩展和变更。

    2024-01-02
    118
  • sql,group by_sql什么时候用having

    sql,group by_sql什么时候用having前言 group by的可以帮助我们在特定场景下查询到我们需要的数据,但group by的用法一直给人一种“飘忽”感,究其原因,还是对于该关键字缺乏深入理解。 下面通过一个例子,来简单解释group…

    2023-02-25
    145
  • Jupyter启动Python代码的教程

    Jupyter启动Python代码的教程Python是一种最流行的编程语言之一,广泛用于数据分析、科学计算以及Web开发等领域。而Jupyter是一种基于Web的交互式计算环境,可以支持多种编程语言,包括Python。Jupyter可以让程序员在一个笔记本中编写和编辑代码,并在同一个环境中查看和分析数据。在这篇文章中,我们将介绍如何使用Jupyter启动Python代码。

    2024-07-29
    36

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注