用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂]

小小码 • 2023-05-31 20:30 • 代码基础 • 阅读 153

大家好，我是考100分的小小码，祝大家学习进步，加薪顺利呀。今天说一说用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂],希望您对编程的造诣更进一步.

代码地址：postgresql-13.1-ml: Integration of CardEst Methods into PostgreSQL by HTTP Server (github.com)

当前进度：可以支持单表查询的基数估计模块的替换。至于多表join的基数估计模块替换还在开发中

注意：本文的重点在于PG的修改。记录一下我的修改思路。

整体流程

PG作为http客户端，向基数估计服务端发送http请求。内容为需要基数估计的sql语句。

基数估计服务端返回该语句的selectivity。

PG收到该查询的selectivity后乘以当前表的大小，即得到rows

用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂]

PG原版基数估计调用逻辑

修改源码

主要修改代码costsize.c

单表修改set_baserel_size_estimates函数

修改逻辑

用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂]

其中get_expr函数的逻辑可参考print.c文件中print_expr函数

多表修改set_joinrel_size_estimates函数

待续

添加第三方库

该项目需要其它两个第三方库

C语言的HTTP服务的client端的库，参考项目：linux下socket（C）构造HTTP客户端
C语言解析json格式的库，参考项目：cJSON

将第三方库的头文件和实现文件加入到PG中：

把http.h 添加到 /src/include/utils/下
costsize.c 添加 #include “utils/http.h”
把cJSON.h 添加到 /src/include/utils/下
把cJSON.c 添加到 /src/backend/utils/adt/下
cJSON.c 把#include “cJSON.h”修改成#include “utils/cJSON.h”
在/src/backend/utils/adt/Makefile添加 cJSON.o
costsize.c 添加 #include “utils/cJSON.h”

效果

单表查询的效果

测试数据集：imdb.title

PG原版计划 VS learned方法的计划

用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂]

最优计划

用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂]

可以看到learned方法基数估计更准确，产生的执行计划与基数估计几乎正常产生的计划一致。而PG原版的基数估计由于准确度太低，导致产生了次优的执行计划。

虽然learned方法的速度没有PG原版快，但产生的计划更优，导致节省了执行时间，所以整体时间更优。

多表查询的效果

待续

待完善

多表查询的基数估计部分还在开发中
当前版本只适用于实验环境。尚未对不支持的查询进行过滤。

参考资料

End-to-End-CardEst-Benchmark
VLDBSS2022实验
PostgreSQL 在内核增加一个配置参数
linux下socket（C）构造HTTP客户端
cJSON使用详细教程 | 一个轻量级C语言JSON解析器
cJSON

原文地址：https://www.cnblogs.com/kitten-t/archive/2022/08/17/16595472.html

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
转载请注明出处: https://daima100.com/4886.html

用HTTP服务的方式集成 learned cardinality estimate 方法进 Postgresql[通俗易懂]

整体流程

PG原版基数估计调用逻辑

主要修改代码costsize.c

单表修改set_baserel_size_estimates函数

多表修改set_joinrel_size_estimates函数

添加第三方库

效果

单表查询的效果

PG原版计划 VS learned方法的计划

最优计划

多表查询的效果

待完善

参考资料

相关推荐

发表回复