【转】MySQL连接超时断开的问题

这遍文章转过来做个笔记,时不时看看。

转:http://blog.csdn.net/nethibernate/article/details/6658855

Exception如下:

[html] view plaincopy

  1. org.hibernate.util.JDBCExceptionReporter - SQL Error:0, SQLState: 08S01
  2. org.hibernate.util.JDBCExceptionReporter - The last packet successfully received from the server was43200 milliseconds ago.The last packet sent successfully to the server was 43200 milliseconds ago, which is longer than the server configured value of ‘wait_timeout‘. You should consider either expiring and/or testing connection validity before use in your application, increasing the server configured values for client timeouts, or using the Connector/J connection ‘autoReconnect=true‘ to avoid this problem.
  3. org.hibernate.event.def.AbstractFlushingEventListener - Could not synchronize database state with session
  4. org.hibernate.exception.JDBCConnectionException: Could not execute JDBC batch update
  5. com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Connection.close() has already been called. Invalid operation in this state.
  6. org.hibernate.util.JDBCExceptionReporter - SQL Error:0, SQLState: 08003
  7. org.hibernate.util.JDBCExceptionReporter - No operations allowed after connection closed. Connection was implicitly closed due to underlying exception/error:
  8. ** BEGIN NESTED EXCEPTION **
  9. com.mysql.jdbc.exceptions.jdbc4.CommunicationsException

先说一下发生这个Exception的大致原因:

MySQL的配置中,有一个叫做“wait_timeout"的参数,这个参数大致的意思是这样:当一个客户端连接到MySQL数据库后,如果客户端不自己断开,也不做任何操作,MySQL数据库会将这个连接保留"wait_timeout"这么长时间(单位是s,默认是28800s,也就是8小时),超过这个时间之后,MySQL数据库为了节省资源,就会在数据库端断开这个连接;当然,在此过程中,如果客户端在这个连接上有任意的操作,MySQL数据库都会重新开始计算这个时间。

这么看来,发生上面Exception的原因就是因为我的服务器和MySQL数据库的连接超过了”wait_timeout"时间,MySQL服务器端将其断开了,但是我的程序再次使用这个连接时没有做任何判断,所以就挂了。

那这个问题怎么解决呢?

在想解决方案的过程中,我发现了几个让我不着头绪的问题:

第一个问题:我们的服务器曾经在设计的过程中考虑过这个事情,所以服务器的主线程有一个定时的check机制,每隔半小时会发送一个"select 1"到数据库来保证连接是活动的,为什么这个check机制不起作用了呢?

第二个问题:从上面的Exception中可以得到这么一个信息:

[java] view plaincopy

  1. The last packet sent successfully to the server was 43200 milliseconds ago, which is longer than the server configured value of ‘wait_timeout‘.

这个信息说的很明白,最后一个成功发到Server的包是43200毫秒之前。但是43200毫秒才43.2秒,也就是说我们的服务器43.2秒之前才和MySQL服务器通过信,怎么会发生超过”wait_timeout“的问题呢?而且MySQL数据库的配置也确实是28800秒(8小时),这又是神马情况呢?

在网上google了n长时间,倒是有不少关于这个问题的讨论,但是一直没有找到让我觉得有效的方法,只能自己结合google到结果来慢慢琢磨了。

首先,MySQL数据库那边的解决方案很单一,就是延长”wait_timeout“的数值。我看有的人直接就延长到一年了,也有人说这个值最大也就是21天,即使值设的再大,MySQL也就只识别21天(这个我没有具体去MySQL的文档中去查)。但是这是一个治标不治本的方法,即使可以一年,也还是会有断的时候,服务器可是要7x24小时在线的呀。

既然MySQL数据库那边没什么好方法,接下来就只能从程序这边来搞了。

先说说程序这边的大致结构吧:两个线程,一个线程负责查询和上面说到的check机制,另一个线程负责定时更新数据库,使用hibernate,配置很简单,都是最基本的,没有任何关于连接池和缓存的配置,就像下面这样:

[html] view plaincopy

  1. <session-factory>
  2. <property name="hibernate.dialect">org.hibernate.dialect.MySQL5InnoDBDialect</property>
  3. <property name="hibernate.connection.driver_class">com.mysql.jdbc.Driver</property>
  4. <property name="hibernate.connection.useUnicode">true</property>
  5. <property name="hibernate.connection.characterEncoding">UTF-8</property>
  6. <property name="hibernate.show_sql">true</property>
  7. <!-- 以下就全是mapping了,省略 -->
  8. </session-factory>

程序中更新的过程大致是这样:

[java] view plaincopy

  1. session = org.hibernate.SessionFactory.openSession();
  2. transaction = session.beginTransaction();
  3. session.update(something);
  4. transaction.commit();
  5. session.close();

在这里,所有关于数据库Connection的连接和关闭都在Hibernate中,因此,不去挖掘Hibernate的源码是不可能了。

在挖掘Hibernate源码之前,必须明确目标:挖掘什么?

其实我的目标很明确,既然断开连接是MySQL数据库做的,那么相对于我们程序这边的问题就是我们在使用完连接之后没有调用Connection.close(),才会保留一个长连接在那里。那么,Hibernate是什么时候开启这个连接,又什么时候调用Connection.close()的呢?

接下来就是Hibernate的源码挖掘中。。。

枯燥的过程就不说了,说说挖掘出的东西:

Hibernate(忘了说了,我们用的Hibernate版本是3.3.2)在上面的那种配置之下,会有一个默认的连接池,名字叫:DriverManagerConnectionProvider;这是一个极其简单的连接池,默认会在池中保留20个连接,这些连接不是一开始Hibernate初始化时就创建好的,而是在你需要使用连接时创建出来,使用完之后才加入到池中的。这里有一个叫closeConnection(Connection conn)的方法,这个方法很NB,它直接将传入的连接不做任何处理,放到池中。而这个类内部的连接池实际是一个ArrayList,每次取得时候remove掉ArrayList的第一个连接,用完后直接用add方法加入到ArrayList的最后。

我们的程序更新时,Hibernate会通过DriverManagerConnectionProvider得到一个连接Connection,在使用完之后,调用session.close()时,Hibernate会调用DriverManagerConnectionProvider的closeConnection方法(就是上面说的那个NB方法),这个时候,该连接会直接放到DriverManagerConnectionProvider的ArrayList中,从始至终也没有地方去调用Connection的close方法。

说到这里,问题就很明显了。

第一,我们的那个”select 1“的check机制和我们服务器程序中更新的逻辑是两个线程,check机制工作时,它会向DriverManagerConnectionProvider获取一个连接,而此时更新逻辑工作时,它会向DriverManagerConnectionProvider获取另外一个连接,两个逻辑工作完之后都会将自己获得的连接放回DriverManagerConnectionProvider的池中,而且是放到那个池的末尾。这样,check机制再想check这两个连接就需要运气了,因为更新逻辑更新完之后就把连接放回池中了,而更新逻辑是定时的,check机制也是定时的,两个定时机制如果总是能错开,那么check机制check的永远都是两个中的一个连接,另外一个就麻烦了。这也就是为什么check机制不好使的原因。

第二,关于Exception信息中那个43200毫秒的问题也就能说明白了,check机制check的总是一个连接,而另外一个过期的连接被更新线程拿跑了,并且在check机制之后没多久就有更新发生,43200毫秒恐怕就是它们之间的间隔吧。

到这里问题分析清楚了,怎么解决呢?

最容易想到的方案,也是网上说的最多的方案,就是延长MySQL端”wait_timeout“的时间。我说了,治标不治本,我觉得不爽,不用。

第二个看到最多的就是用”autoReconnect = true"这个方案,郁闷的是MySQL 5之后的数据库把这个功能给去了,说会有副作用(也没具体说有啥副作用,我也懒得查),我们用的Hibernate 3.3.2这个版本也没有autoReconnect这个功能了。

第三个说的最多的就是使用c3p0池了,况且Hibernate官网的文档中也提到,默认的那个连接池非常的屎,仅供测试使用,推荐使用c3p0(让我郁闷的是我连c3p0的官网都没找到,只在sourceForge上有个项目主页)。好吧,我就决定用c3p0来搞定这个问题。

用c3p0解决这个Exception问题:(点击这里进入我参考的博客,要FQ哦,亲!)

首先很明了,只要是池它就肯定有这个问题,除非在放入池之前就把连接关闭,那池还顶个屁用。所以我参考的博客里说到,最好的方式就是在获取连接时check一下,看看该连接是否还有效,即该Connection是否已经被MySQL数据库那边给关了,如果关了就重连一个。因此,按照这个思路,我修正了Hibernate的配置文件,问题得到了解决:

[html] view plaincopy

  1. <session-factory>
  2. <property name="hibernate.dialect">org.hibernate.dialect.MySQL5InnoDBDialect</property>
  3. <property name="hibernate.connection.driver_class">com.mysql.jdbc.Driver</property>
  4. <property name="hibernate.connection.useUnicode">true</property>
  5. <property name="hibernate.connection.characterEncoding">UTF-8</property>
  6. <property name="hibernate.show_sql">true</property>
  7. <!-- c3p0在我们使用的Hibernate版本中自带,不用下载,直接使用 -->
  8. <property name="hibernate.connection.provider_class">org.hibernate.connection.C3P0ConnectionProvider</property>
  9. <property name="hibernate.c3p0.min_size">5</property>
  10. <property name="hibernate.c3p0.max_size">20</property>
  11. <property name="hibernate.c3p0.timeout">1800</property>
  12. <property name="hibernate.c3p0.max_statements">50</property>
  13. <property name="hibernate.c3p0.maxIdelTime">1800</property>
  14. <!-- 下面这句很重要,后面有解释 -->
  15. <property name="hibernate.c3p0.testConnectionOnCheckout">true</property>
  16. <!-- 以下就全是mapping了,省略 -->
  17. </session-factory>

上面配置中最重要的就是hibernate.c3p0.testConnectionOnCheckout这个属性,它保证了我们前面说的每次取出连接时会检查该连接是否被关闭了。不过这个属性会对性能有一些损耗,引用我参考的博客上得话:程序能用是第一,之后才是它的性能(又不是不能容忍)。

当然,c3p0自带类似于select 1这样的check机制,但是就像我说的,除非你将check机制的间隔时间把握的非常好,否则,问题是没有解决的。

好了,至此,困扰我的问题解决完了。希望上面的这些整理可以为我以后碰到类似的问题留个思路,也可以为正在被此问题困扰的人提供一丝帮助。

2、使用dbcp数据源

由于mysql的默认最大空闲时间8小时,所以只要把minEvictableIdleTimeMillis设置小于此值即可。例如配置每十分钟检查超过空闲一个小时的连接

	<property name="minEvictableIdleTimeMillis">
		<value>3600000</value>
	</property>
	<property name="timeBetweenEvictionRunsMillis">
		<value>600000</value>
	</property>

3、proxool
数据源

数据库连接池proxool,它有两个属性:一个是test-before-use,还有一个是test-after-use,这两个属性就是在使用前和使用后都要进行对连接的检查,如果连接无效就扔掉再创建一个新的连接

4、

testConnectionOnCheckout:
因性能消耗大请只在需要的时候使用它。如果设为true那么在每个connection提交的时候都 将校验其有效性。建议使用 idleConnectionTestPeriod或automaticTestTable

等方法来提升连接测试的性能。默认为false;

(1)idleConnectionTestPeriod

当数据库重启后或者由于某种原因进程被杀掉后,C3P0不会自动重新初始化数据库连接池,当新的请求需要访问数据库的时候,此时会报错误(因为连接失效),同时刷新数据库连接池,丢弃掉已经失效的连接,当第二个请求到来时恢复正常。

C3P0目前没有提供当获取已建立连接失败后重试次数的参数,只有获取新连接失败后重试次数的参数(acquireRetryAttempts【默认为30】 )。

要解决此问题,可以通过设置idleConnectionTestPeriod【默认为0,表示不检查 】参数折中解决,该参数的作用是设置系统自动检查连接池中连接是否正常的一个频率参数,时间单位是秒 。

(2)acquireIncrement

当连接池中的的连接耗尽的时候c3p0一次同时获取的连接数,也就是说,如果使用的连接数已经达到了maxPoolSize,c3p0会立即建立新的连接。

(3)maxIdleTime

另外,C3P0默认不会close掉不用的连接池,而是将其回收到可用连接池中,这样会导致,连接数越来越大,所以需要设置maxIdleTime【默认0,表示永远不过期】,单位是秒,maxIdleTime表示idle状态的connection能存活的最大时间。

时间: 2024-10-20 11:40:47

【转】MySQL连接超时断开的问题的相关文章

MySQL连接问题【如何解决MySQL连接超时关闭】

--MySQL连接问题[如何解决MySQL连接超时关闭] ------------------------------------------------转载 最近做网站有一个站要用到WEB网页采集器功能,当一个PHP脚本在请求URL的时候,可能这个被请求的网页非常慢慢,超过了mysql的 wait-timeout时间,然后当网页内容被抓回来后,准备插入到MySQL的时候,发现MySQL的连接超时关闭了,于是就出现了"MySQL server has gone away"这样的错误提示

Solaris10 如何设置空闲ssh连接超时断开

在ssh的配置文件中有2个参数可以控制空闲连接超时断开.这2个参数是ClientAliveCountMax和ClientAliveInterval. Solaris10上设置空闲ssh连接超时断开的方法如下: 修改/etc/ssh/sshd_config文件,在文件中加入以下内容: ClientAliveCountMax = 0 ClientAliveInterval = 600 #单位是秒 然后重启ssh服务: #> svcadm restart ssh 这两个参数的说明参见man sshd_

Putty解决SSH连接超时断开的问题

1 在 linux下的ssh命令:vim /etc/ssh/ssh_config 然后找到里面的ServerAliveInterval 参数,如果没有你同样自己加一个就好了.参数意义相同,都是秒数,比如9分钟: ServerAliveInterval 540 putty中解决SSH连接超时断开的两种方法 2 Putty 启用putty keepalive putty -> Connection -> Seconds between keepalives ( 0 to turn off ),默认

如何解决MySQL连接超时关闭

最近做网站有一个站要用到WEB网页采集器功能,当一个PHP脚本在请求URL的时候,可能这个被请求的网页非常慢慢,超过了mysql的 wait-timeout时间,然后当网页内容被抓回来后,准备插入到MySQL的时候,发现MySQL的连接超时关闭了,于是就出现了"MySQL server has gone away"这样的错误提示,解决这个问题,我的经验有以下两点,或许对大家有用处: 第一种方法: 当然是增加你的 wait-timeout值,这个参数是在my.cnf(在Windows下台

mysql连接超时问题

前几天使用个脚本不停的查看redis队列中的事件.如果有则把事件取出来,然后进行一些数据库操作. 后来发现,每天的第一次有事件时都会到导致,找不到数据. 后来定位到问题,是mysql在连接长时间无活动的情况下,将连接断开.php在有事件,准备从数据库中获取数据时,捕获到mysql已断开的错误. 解决方案有两个: 修改mysql配置文件,my.cnf [mysqld] interactive_timeout=600 wait_timeout=600 两个参数都要同时设置. 相关参考:http://

mysql连接超时的问题

使用Hibernate + MySQL数据库开发,链接超时问题: com.mysql.jdbc.CommunicationsException: The last packet successfully received from the server was58129 seconds ago.The last packet sent successfully to the server was 58129 seconds ago, which is longer than the server

mysql连接超时的问题处理

1. 内网 ts 连接mysql 有时候会连接失败, 原因是 连接超时, 当时所有服务器一起启动,抢占资源,导致连接超过10s. 现在增加一次连接机会, 增加一些日志. 2. 并且对mysql 全局参数 连接超时设置为 20秒. SET GLOBAL connect_timeout = 20

转 MySQL连接超时

在负载较重的MySQL服务器上,有时你偶尔会看到一些连接超时的错误,诸如: Can’t connect to MySQL server on ‘mydb’(110).如果当时你有多个连接请求,你会发现其它连接却没问题.这类问题开始时很不显眼,且长时间来看几乎可以忽略不计(注:次数不 多),类似于百万分之一的发生率,但是在服务器负载不断加重时,可能出现的频率将有所上升. 如果你对连接进行计时你会发现,连接一般都接近3-9秒.这个时长有时也很诡异,多年前我就曾遇到过一次,当时数据库请求连接被重置,S

MySQL连接超时处理

1.由于MySQL默认是8小时的wait_timeout,当超过8小时的连接时间后,在JAVA中调用将出现如下报错 SEVERE EXCEPTION com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: The last packet successfully received from the server was175588 seconds ago.The last packet sent successfully to the s