mysql_ping()以及MYSQL_OPT_RECONNECT MySQL server has gone away”错误

来源:http://www.felix021.com/blog/read.php?2102

昨天@Zind同学找到我之前的一篇blog(已经修改),里面提到了mysql_ping和MYSQL_OPT_RECONNECT的一些事情。

之所以写那篇blog,是因为去年写的一些代码遇到了“2006:MySQL server has gone away”错误。这个问题是因为wait_timeout这个参数的默认值是28800,也就是说,如果一个连接连续8个小时没有任何请求,那么Server端就会把它断开。在测试环境中一个晚上没有请求很正常……于是第二天早上来的时候就发现这个错误了。

其实我有考虑这个问题的,真的……因为我知道php里面有个函数叫做mysql_ping(),PHP手册上说:“mysql_ping() 检查到服务器的连接是否正常。如果断开,则自动尝试连接。本函数可用于空闲很久的脚本来检查服务器是否关闭了连接,如果有必要则重新连接上。”

回想起来,以前真是很傻很天真。根据MySQL官方C API里mysql_ping()的文档:"Checks whether the connection to the server is working. If the connection has gone downand auto-reconnect
is enabled
an attempt to reconnect is made. ... Auto-reconnect is disabled by default. To enable it, call mysql_options() with the MYSQL_OPT_RECONNECT option",也就是说,它实际上还依赖于MYSQL_OPT_RECONNECT这个配置,而这个配置默认(自5.0.3开始)是关闭的!

虽然想起来很愤怒很蛋疼,不过看到 libmysql/client.c: mysql_init() 里的注释就淡定了:

引用

By default we don‘t reconnect because it could silently corrupt data (after reconnection you potentially lose table locks, user variables, session variables (transactions but they are specifically dealt with in mysql_reconnect()). 
This is a change: < 5.0.3 mysql->reconnect was set to 1 by default.

好吧,既然有问题,那就正视它。解决办法是调用 mysql_options ,将MYSQL_OPT_RECONNECT设置为1:

char value = 1;

mysql_options(mysql, MYSQL_OPT_RECONNECT, &value);

但是!! 在mysql 5.0.19 之前,mysql->reconnect = 0 这一句是放在 mysql_real_connect()里面的!也就是说,如果你不能像处理其他选项一样,而是必须在mysql_real_connect()之前设置MYSQL_OPT_RECONNECT,坑爹啊!

好吧好吧,总之,关于坑的问题暂告一段落,结论就是,不管是哪个版本,如果你想要启用自动重连,最好都是在mysql_real_connect()之后,反正不会错。

然后这篇的重点来了(前面似乎太罗嗦了点):MYSQL_OPT_RECONNECT的文档里头说了,这个选项是用来启用/禁用(当发现连接断开时的)自动重连,那么,MYSQL什么时候会发现链接断开呢?

这个问题可能太大了,不过不妨先去追一下,mysql_ping()做了啥。

下载源码 http://cdn.mysql.com/Downloads/MySQL-5.1/mysql-5.1.67.tar.gz ,解压以后ctags -R,再vim -t mysql_ping ,马上就定位到了,似乎太简单了点:

int STDCALL

mysql_ping(MYSQL *mysql)

{

int res;

DBUG_ENTER("mysql_ping");

res= simple_command(mysql,COM_PING,0,0,0);        //试着向服务器发送一个ping包

if (res == CR_SERVER_LOST && mysql->reconnect)    //如果server挂了,而mysql->reconnect为true

res= simple_command(mysql,COM_PING,0,0,0);      //再ping一次??

DBUG_RETURN(res);

}

好吧,看来关键在于这个simple_command了。ctrl+],原来是这样:

#define simple_command(mysql, command, arg, length, skip_check) \

(*(mysql)->methods->advanced_command)(mysql, command, 0, 0, arg, length, skip_check,NULL)

好吧,先去追一下MYSQL,里头有个 const struct st_mysql_methods *methods ,再追一下 st_mysql_methods ....

typedef struct st_mysql_methods

{

my_bool (*read_query_result)(MYSQL *mysql);

my_bool (*advanced_command)(MYSQL *mysql, enum enum_server_command command,

const unsigned
char *header, unsigned long header_length,

const unsigned
char *arg, unsigned long arg_length,

my_bool skip_check, MYSQL_STMT *stmt);

......

坑爹啊!又是这种鸟代码!蛋疼的C语言!struct只有属性没有方法!没办法,只能暴力了:

引用

find -name ‘*.c‘ -exec /bin/grep ‘{}‘ -Hne ‘mysql->methods *=‘ ‘;‘

./libmysql_r/client.c:1907:  mysql->methods= &client_methods;

./sql-common/client.c:1907:  mysql->methods= &client_methods;

./libmysql/client.c:1907:  mysql->methods= &client_methods;

./libmysqld/libmysqld.c:120:  mysql->methods= &embedded_methods;

./sql/client.c:1907:  mysql->methods= &client_methods;

果断追到client_methods:

static MYSQL_METHODS client_methods=

{

cli_read_query_result,                      /* read_query_result */

cli_advanced_command,                        /* advanced_command */

...

也就是说simple_command最后调用了cli_advanced_command这个函数。前面的 simple_command(mysql,COM_PING,0,0,0) 相当于是调用了 cli_advanced_command(mysql, COM_PING, 0, 0, 0, 0, 0, NULL) 。

这个函数做了啥呢。。。其实也不复杂:

1. 设置默认返回值为1 (意外出错goto时被返回)

2. 设置sigpipe的handler(以便忽略它)

3. 如果 mysql->net.vio == 0 ,那么调用mysql_reconnect重连,失败的话就返回1

4. mysql没准备好,返回1

5. 清除之前的信息(错误码、缓冲区、affected_rows)等等

6. 调用net_write_command将命令发送给server,如果失败:

6.1 检查错误信息,如果是因为发送包太大,goto end

6.2 调用end_server(mysql)关闭连接

6.3 调用mysql_reconnect尝试重连,如果失败goto end

6.4 再次调用net_write_command将命令发送给server,失败则goto end

7. 设置result = 0(发送成功)

8. 如果参数中要求检查server的返回,则读取一个packet进行检查(失败的话就result=1)

9. (end标签)

10. 恢复sigpipe

11. 返回result

可以看到,这里两次调用了mysql_reconnect,但都是有条件的:第一次是在mysql->net.vio == 0的情况下,第二次是net_write_command失败且不是因为包太大的情况。vio相关的代码看得一头雾水,实在找不出头绪,于是决定暴力一点:直接修改这个函数,加入一堆fprintf(stderr, ...)(具体加在哪里就不说了,反正使劲塞就是了),然后写了一个C代码:

#include <stdio.h>

#include <stdlib.h>

#include <mysql/mysql.h>

void do_err(MYSQL *mysql) {

if (mysql_errno(mysql)) {

fprintf(stderr, "%d:%s\n", mysql_errno(mysql), mysql_error(mysql));

exit(mysql_errno(mysql));

}

}

int main()

{

MYSQL * mysql = mysql_init(NULL);

do_err(mysql);

mysql_real_connect(mysql, "127.0.0.1", "root", "123456", "test", 3306,
NULL, 0);

do_err(mysql);

char value = 1;

mysql_options(mysql, MYSQL_OPT_RECONNECT, &value);

char cmd[1024] = "SELECT * FROM t";

while (1) {

mysql_query(mysql, cmd);

do_err(mysql);

MYSQL_RES *result = mysql_store_result(mysql);

MYSQL_ROW  row;

while ((row = mysql_fetch_row(result)) !=
NULL) {

int i, num_fields = mysql_num_fields(result);

for (i = 0; i < num_fields; i++)

printf("%s\t", row[i] ? row[i] : "NULL");

//注意上一句是不是二进制安全的,因为row里头可能包含\0,也可能末尾没有\0

printf("\n");

}

mysql_free_result(result);

printf("press enter..."); getchar();

}

mysql_close(mysql);

return 0;

}

运行输出:

引用

inside mysql_real_query

mysql->net.vio = 0x90e760

mysql->status = 0

net write_command

after send_query

---

1

2

press enter...//按回车之前先重启一下mysql server,下面这几句按照函数调用层次进行手动缩进了……

inside mysql_real_query

mysql->net.vio = 0x90e760 //进入cli_advanced_command

mysql->status = 0

net_write_command

end_server //说明net_write_command失败了

inside mysql_reconnect //它会调用mysql_real_query

inside mysql_real_query

mysql->net.vio = 0x919990 //于是又回到了cli_advanced_command

mysql->status = 0

net_write_command //这次成功了

after send_query  //这句我是写在mysql_real_query里面的

reconnect succeded

after reconnect: mysql->status = 0

after send_query //所以又来一次。。

根据fprintf的输出,发现在正常情况下,mysql->net.vio这个指针并不等于0,所以第一个mysql_reconnect不会被调用。而net_write_command也是正确执行,第二个reconnect也没被调用。

而在执行完一个query,然后重启mysql server再执行query (mysql_query => mysql_real_query => mysql_send_query => cli_advanced_command),就会发现,mysql->net.vio仍然不等于0,但是net_write_command失败了,于是先调用了end_server()(这里面会将mysql->net.vio设置为0,不过不影响后面的流程...),然后调用了第二个reconnect,这个reconnect会调用mysql_init()以及mysql_real_query()执行一些初始化的命令,于是又回到cli_advanced_command,再一步一步回溯。。。

综上可知,如果设置了MYSQL_OPT_RECONNECT(),那么mysql_query()是可以完成自动重连的。实际上,由于cli_advanced_command会在必要情况下调用mysql_reconnect(实际上这个函数也只在这里被调用),因此,所有用到了cli_read_query_result的地方(或者simple_command),也都可以完成自动重连。

完结。

//混蛋,这篇纯粹是为了凑一月至少一篇这个目标啊!

--

转转 http://blog.chinaunix.net/uid-22957904-id-3594136.html

转载请注明出自 http://www.felix021.com/blog/read.php?2102 ,如是转载文则注明原出处,谢谢:)

Google Reader 订阅 点击这里,RSS地址: http://www.felix021.com/blog/feed.php

时间: 2024-08-27 14:35:58

mysql_ping()以及MYSQL_OPT_RECONNECT MySQL server has gone away”错误的相关文章

Navicat中MySQL server has gone away错误怎么办【转载】

转载链接:http://www.111cn.net/database/mysql/64073.htm mysql数据库出现MySQL server has gone away错误一般是sql语句太大导致了,下面们在使用Navicat中操作数据库时提示MySQL server has gone away问题解决办法. 备份数据时,生成的sql文件比较大,当然,这个sql是包含了比较多的冗余数据.用Navicat直接导入的话,报错MySQL server has gone away.如下图所示: 解

mysql导入大量数据时报MySQL server has gone away错误的解决办法

在我们使用mysql导入大文件sql时可能会报MySQL server has gone away错误,该问题是max_allowed_packet配置的默认值设置太小,只需要相应调大该项的值之后再次导入便能成功.该项的作用是限制mysql服务端接收到的包的大小,因此如果导入的文件过大则可能会超过该项设置的值从而导致导入不成功!下面我们来看一下如何查看以及设置该项的值. 查看 max_allowed_packet 的值 mysql> show global variables like 'max

python测试开发django-58.MySQL server has gone away错误的解决办法

前言 使用django执行sql相关操作的时候,出现一个"MySQL server has gone away"错误,后来查了下是sql执行过程中,导入的文件较大时候,会出现这个异常. 检查了下sql语句,确实有插入图片,图片较大导致出现MySQL server has gone away. 该问题是max_allowed_packet配置的默认值设置太小,只需要相应调大该项的值之后再次导入便能成功. 该项的作用是限制mysql服务端接收到的包的大小,因此如果导入的文件过大则可能会超过

MySQL server has gone away错误的解决办法

在我们使用mysql导入大文件sql时可能会报MySQL server has gone away错误,该问题是max_allowed_packet配置的默认值设置太小,只需要相应调大该项的值之后再次导入便能成功.该项的作用是限制mysql服务端接收到的包的大小,因此如果导入的文件过大则可能会超过该项设置的值从而导致导入不成功!下面我们来看一下如何查看以及设置该项的值. 查看 max_allowed_packet 的值 show global variables like 'max_allowe

MySQL server has gone away 错误处理

解决方案1: 这个是mysql自身的一个机制:     mysql连接的空闲时间超过8小时后 MySQL自动断开该连接解决办法有两个:     1.修改mysql 配置               增加 MySQL 的 wait_timeout 属性的值      2.定时访问 mysql, 维持 mysql连接的 空闲时间               在应用中, 写个定时任务, 定时去访问 mysql 数据库 以上介绍了" django数据库重连机制"的问题解答,希望对有需要的网友有

蛋疼的mysql_ping()以及MYSQL_OPT_RECONNECT

From: https://www.felix021.com/blog/read.php?2102 昨天@Zind同学找到我之前的一篇blog(已经修改),里面提到了mysql_ping和MYSQL_OPT_RECONNECT的一些事情. 之所以写那篇blog,是因为去年写的一些代码遇到了“2006:MySQL server has gone away”错误.这个问题是因为wait_timeout这个参数的默认值是28800,也就是说,如果一个连接连续8个小时没有任何请求,那么Server端就会

pcntl_fork 导致 MySQL server has gone away 解决方案

pcntl_fork 前连数据库,就会报 MySQL server has gone away 错误.原因是子进程会继承主进程的数据库连接,当mysql返回数据时,这些子进程都可以通过这个连接读到数据,造成数据错乱. 该操作数据库的地方还是要操作数据库: 要解决这个问题,要在 $pid = pcntl_fork();  前清理掉之前的MySQL连接: 官方文档的解释以及解决方案 http://php.net/manual/en/function.pcntl-fork.php#70721 于是我如

ERROR 2003 (HY000): Can&#39;t connect to MySQL server on &#39;ip&#39;(111)

问题描述:  从一台linux远程连接另一台linux上的MySQL, 出现ERROR 2003 (HY000): Can't connect to MySQL server on 'ip'(111)错误.   [[email protected] ~]$ mysql -hxxx.xxx.xxx.85 -uroot -p Enter password:  123456   ERROR 2003 (HY000): Can't connect to MySQL server on 'xxx.xxx.

MySQL server has gone away

General error: 2006 MySQL server has gone away 发布: 来源: 添加日期:2014-10-02 23:00:56 浏览:146 评论:0 如果我们单看mysql提示MySQL server has gone away就是由于种种原因导致mysql当机了,导致MySQL server has gone away的原因有很多种,下面我来总结一下. 我自己人的经历:先简单介绍一下这个新手卡录入后台,这个后台是提供给产品人员使用,可以向某个游戏的某个特定分区