redis报错:read error on connection的两种原因分析[通俗易懂]

redis报错:read error on connection的两种原因分析[通俗易懂]最近线上php模块偶现 read error on connection;具体报错日志如下 Uncaught exception 'RedisException' with me…

redis报错:read error on connection的两种原因分析

Uncaught exception "RedisException" with message "read error on connection"

代码100分

通过分析和学习之后,发现两种原因可能导致 phpredis 返回 “read error on connection”:

  • 执行超时
  • 使用已经断开的连接

下面将对这两种情况进行具体的分析。

一、执行超时

超时又可以分两种情况:一种是客户端设置的超时时间过短导致的;另外一种是客户端未设置超时时间,但是服务端执行时间超过了默认超时时间设置。

1.1 模拟复现

1.1.1 客户端设置超时时间过短

测试环境的 get 操作 执行耗时约 0.1ms 数量级;因此客户端设置执行超时时间为0.01ms, 测试脚本如下:

代码100分<?php $rds = new Redis(); try { $ret = $rds->pconnect("127.0.0.1", 6390); if ($ret == false) { echo "Connect return false"; exit; } //设置超时时间为 0.1ms $rds->setOption(3,0.0001); $rds->get("aa"); } catch (Exception $e) { var_dump ($e); } 

手动执行该脚本会捕获”read error on connection”异常;

redis报错:read error on connection的两种原因分析[通俗易懂]

1.1.2 客户端未设置超时时间,使用默认超时时间

客户端未设置超时时间,但是在命令执行的过程中,超时达到php设置的默认值,详见 phpredis subscribe超时问题及解决 分析

1.2 原因分析

1.2.1 strace 分析

通过strace 查看执行过程可以发现发送 get aa 指令后,poll 想要拉取 POLLIN 事件的时候等待超时:

redis报错:read error on connection的两种原因分析[通俗易懂]

1.2.2 代码逻辑分析

php连接redis 使用的是phpredis扩展,在phpredis源码中全文搜索 “read error on connection” 可以发现 此错误位于 phpredis/library.c 文件的 redis_sock_gets 函数,详见 phpredis ;

phpredis 的 library.c 文件的 redis_sock_gets 函数

/* * Processing for variant reply types (think EVAL) */

PHP_REDIS_API int
redis_sock_gets(RedisSock *redis_sock, char *buf, int buf_size,
                size_t *line_size)
{
    // Handle EOF
    if(-1 == redis_check_eof(redis_sock, 0)) {
        return -1;
    }

    if(php_stream_get_line(redis_sock->stream, buf, buf_size, line_size)
                           == NULL)
    {
        char *errmsg = NULL;

        if (redis_sock->port < 0) {
            spprintf(&errmsg, 0, "read error on connection to %s", ZSTR_VAL(redis_sock->host));
        } else {
            spprintf(&errmsg, 0, "read error on connection to %s:%d", ZSTR_VAL(redis_sock->host), redis_sock->port);
        }
        // Close our socket
        redis_sock_disconnect(redis_sock, 1);

        // Throw a read error exception
        REDIS_THROW_EXCEPTION(errmsg, 0);
        efree(errmsg);
        return -1;
    }

    /* We don"t need */
    *line_size-=2;
    buf[*line_size]="";

    /* Success! */
    return 0;
}

附: 这个msg 看着比线上的msg 多了 host 和 port , 是因为最近合并分支的原因,如图

redis报错:read error on connection的两种原因分析[通俗易懂]

从源码中可以发现如果php_stream_get_line读取stream数据为NUll的时候就会抛出read error on connection这个错误。那么什么时候php_stream_get_line会返回NULL呢, 对应于php源码的php-src/main/streams/streams.c 文件 , 详见php-src;

代码100分/* If buf == NULL, the buffer will be allocated automatically and will be of an * appropriate length to hold the line, regardless of the line length, memory * permitting */
PHPAPI char *_php_stream_get_line(php_stream *stream, char *buf, size_t maxlen,
        size_t *returned_len)
{
    size_t avail = 0;
    size_t current_buf_size = 0;
    size_t total_copied = 0;
    int grow_mode = 0;
    char *bufstart = buf;

    if (buf == NULL) {
        grow_mode = 1;
    } else if (maxlen == 0) {
        return NULL;
    }

    /* * If the underlying stream operations block when no new data is readable, * we need to take extra precautions. * * If there is buffered data available, we check for a EOL. If it exists, * we pass the data immediately back to the caller. This saves a call * to the read implementation and will not block where blocking * is not necessary at all. * * If the stream buffer contains more data than the caller requested, * we can also avoid that costly step and simply return that data. */

    for (;;) {
        avail = stream->writepos - stream->readpos;

        if (avail > 0) {
            size_t cpysz = 0;
            char *readptr;
            const char *eol;
            int done = 0;

            readptr = (char*)stream->readbuf + stream->readpos;
            eol = php_stream_locate_eol(stream, NULL);

            if (eol) {
                cpysz = eol - readptr + 1;
                done = 1;
            } else {
                cpysz = avail;
            }

            if (grow_mode) {
                /* allow room for a NUL. If this realloc is really a realloc * (ie: second time around), we get an extra byte. In most * cases, with the default chunk size of 8K, we will only * incur that overhead once. When people have lines longer * than 8K, we waste 1 byte per additional 8K or so. * That seems acceptable to me, to avoid making this code * hard to follow */
                bufstart = erealloc(bufstart, current_buf_size + cpysz + 1);
                current_buf_size += cpysz + 1;
                buf = bufstart + total_copied;
            } else {
                if (cpysz >= maxlen - 1) {
                    cpysz = maxlen - 1;
                    done = 1;
                }
            }

            memcpy(buf, readptr, cpysz);

            stream->position += cpysz;
            stream->readpos += cpysz;
            buf += cpysz;
            maxlen -= cpysz;
            total_copied += cpysz;

            if (done) {
                break;
            }
        } else if (stream->eof) {
            break;
        } else {
            /* XXX: Should be fine to always read chunk_size */
            size_t toread;

            if (grow_mode) {
                toread = stream->chunk_size;
            } else {
                toread = maxlen - 1;
                if (toread > stream->chunk_size) {
                    toread = stream->chunk_size;
                }
            }

            php_stream_fill_read_buffer(stream, toread);

            if (stream->writepos - stream->readpos == 0) {
                break;
            }
        }
    }

    if (total_copied == 0) {
        if (grow_mode) {
            assert(bufstart == NULL);
        }
        return NULL;
    }

    buf[0] = "";
    if (returned_len) {
        *returned_len = total_copied;
    }

    return bufstart;
}

从 php_stream_get_line方法中可以看出 只有 bufstart=NULL的时候才会返回NULL,bufstart=NULL说明并未在buf缓冲和stream中接收到任何数据,包括终止符。

1.3 解决方案

客户端设置合理的超时时间,有两种方式:

1.3.1 int_set

ini_set(“default_socket_timeout”, -1);

1.3.2 setOption

$redis->setOption(Redis::OPT_READ_TIMEOUT, -1);

注: -1均表示不超时,也可以将超时设置为自己希望的时间, 前面复现时就是设为为0.01ms

二、重新使用已经断开的连接

使用已经断开的连接也有可能导致 “read error on connection”, 这里需要区分 “Connection closed” 和 “Connection lost”。

2.1 连接断开

2.1.1 Connection closed

测试脚本如下,客户端主动关闭连接,但是下文接着使用该断开的链接,然后抛出异常返回 connection closed

<?php $rds = new Redis(); try { $ret = $rds->pconnect("127.0.0.1", 6390); if ($ret == false) { echo "Connect return false"; exit; } $rds->close(); var_dump($rds->get("aa")); } catch (Exception $e) { var_dump ($e); }

测试结果如下:

redis报错:read error on connection的两种原因分析[通俗易懂]

2.1.2 Connection lost

参考Work around PHP bug of liveness checking 编写测试脚本 test.php 如下,连接上redis之后,在执行命令前kill redis 进程:

<?php $rds = new Redis(); try { $ret = $rds->pconnect("127.0.0.1", 6390); if ($ret == false) { echo "Connect return false"; exit; } echo "Press any key to continue ..."; fgetc(STDIN); var_dump($rds->get("aa")); } catch (Exception $e) { var_dump ($e); }

如果

执行步骤如下

  1. 终端执行 php test.php 脚本
  2. 另开一个终端 kill redis 进程
  3. 第一个终端任意输入、回车

此时会出现 “Connection lost”

redis报错:read error on connection的两种原因分析[通俗易懂]

2.1.3 read error on connection

连接上redis之后,不断执行命令的过程中,如果连接断开,会返回 read error on connection。测试脚本如下:

<?php $rds = new Redis(); try { $ret = $rds->pconnect("127.0.0.1", 6390); if ($ret == false) { echo "Connect return false"; exit; } while(1){ $rds->get("aa"); } } catch (Exception $e) { var_dump ($e); }

如果

执行步骤如下

  1. 终端执行 php test.php 脚本
  2. 另开一个终端 kill redis 进程

此时抛出异常:

redis报错:read error on connection的两种原因分析[通俗易懂]

或者新打开终端连接上redis服务端,执行client kill ,如下:

redis报错:read error on connection的两种原因分析[通俗易懂]

正在执行的php脚本同样会捕获该异常read error on connection。

2.2 php-fpm & pconnect

在cli 模式下, 通过php通过 pconnect 连接redis服务端,虽然业务代码,显示调用close, 但是实际上该连接并未断开,fpm 会维护到redis 的连接,下个请求再次执行pconnect 的时候并不会真正请求redis 建立连接。这样同样会带来一个问题,假如这个连接已经断开了,下个请求可能直接使用上个断开的连接,对此,phpredis 在其源码也有注释,详见php-src

redis报错:read error on connection的两种原因分析[通俗易懂]

因此php-fpm reuse 一个断开的连接可能导致此类错误。

此种情况最简单的解决方案就是改长链接为短链接了

三、小结

网上有很多关于 执行超时及其解决方案的分析,但是对于连接断开重新使用的分析较少,故此分析之,一方面用作记录,另一方面希望能够给面临同样问题的小伙伴一点帮助。

四、参考

[1] redis read error on connection和Redis server went away错误排查

[2] Work around PHP bug of liveness checking

[3] phpredis subscribe超时问题及解决

[4] php-src

[5] phpredis

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/9641.html

(0)
上一篇 2023-02-04 10:00
下一篇 2023-02-04

相关推荐

  • Python邮件发送测试:如何确保邮件的送达性和有效性

    Python邮件发送测试:如何确保邮件的送达性和有效性在现代社会,邮件已经成为人们不可或缺的沟通工具。而Python作为一种强大的编程语言,也提供了多种邮件发送的库和模块。然而,虽然发送邮件变得非常简单,但仍然存在一些问题需要我们注意。本文将从多个方面详细阐述如何确保邮件的送达性和有效性。

    2024-03-06
    79
  • spark计算模型RDD[通俗易懂]

    spark计算模型RDD[通俗易懂]RDD介绍 1.RDD概念以及特性 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行

    2023-02-08
    151
  • 用Python中的beautifulsoup4(bs4)库进行网页解析

    用Python中的beautifulsoup4(bs4)库进行网页解析现代互联网中,网站数量多达数十亿,每一个网站都包含了数量巨大的信息,大部分的信息都被储存在网页中。如果我们希望从网站中获取自己所需要的信息,就需要使用网页解析的技术。在Python中,beautifulsoup4(bs4)是一个强大的网页解析库,它可以轻松地从HTML或XML文件中提取并筛选信息。

    2024-07-03
    59
  • 还在为数据库事务一致性检测而苦恼?让Elle帮帮你,以TDSQL为例我们测测 | DB·洞见#7[通俗易懂]

    还在为数据库事务一致性检测而苦恼?让Elle帮帮你,以TDSQL为例我们测测 | DB·洞见#7[通俗易懂]数据库用户通常依赖隔离级别来确保数据一致性,但很多数据库却并未达到其所表明的级别。主要原因是:一方面,数据库开发者对各个级别的理解有细微差异;另一方面,实现层面没有达到理论上的要求。 用户在使用或开发

    2023-06-15
    146
  • 为什么 SQL 语句使用了索引,但却还是慢查询?「终于解决」

    为什么 SQL 语句使用了索引,但却还是慢查询?「终于解决」聊一聊索引和慢查询,经常遇到的一个问题:一个SQL语句使用了索引,为什么还是会记录到慢查询日志之中?

    2023-05-21
    147
  • Python执行CMD命令

    Python执行CMD命令Python是一款功能强大的编程语言,在开发和运维领域都有广泛的应用。在进行系统管理、监控、调试等工作过程中,经常需要与CMD命令打交道。Python提供了大量的方法来执行CMD命令,帮助用户更快捷地完成工作。

    2024-04-24
    63
  • python进阶(十三、mysql:PyMySQL)

    python进阶(十三、mysql:PyMySQL)
    3.mysql数据库 3.15 使用python操作mysql数据库(PyMySQL) 3.15.1. PyMySQL的安装 1)使用命令安装:pip in…

    2023-04-06
    163
  • 使用Pycharm设置代码编码格式

    使用Pycharm设置代码编码格式 在编写代码过程中,正确地设置编码格式显得十分重要,否则代码可能会因为编码不对而出现各种错误,而这些错误也可能会是隐藏的,难以发现。在本文中,我们将介绍如何使用Pycharm来正确设置代码的编码格式。

    2024-06-17
    45

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注