SimpleDateFormat 的线程安全问题
SimpleDateFormat 是一个以国别敏感的方式格式化和分析数据的具体类。 它允许格式化 (date -> text)、语法分析 (text -> date)和标准化。
但是 SimpleDateFormat 并不是一个线程安全的类,在多线程并发访问下会出现问题。通过以下代码进行检验,
public class ProveNotSafe { static SimpleDateFormat df = new SimpleDateFormat("dd-MMM-yyyy", Locale.US); static String testdata[] = { "01-Jan-1999", "14-Feb-2001", "31-Dec-2007" }; public static void main(String[] args) { Runnable r[] = new Runnable[testdata.length]; for (int i = 0; i < r.length; i++) { final int i2 = i; r[i] = new Runnable() { public void run() { try { for (int j = 0; j < 1000; j++) { String str = testdata[i2]; String str2 = null; /* synchronized(df) */{ Date d = df.parse(str); str2 = df.format(d); System.out.println("i: " + i2 + "\tj: " + j + "\tThreadID: " + Thread.currentThread().getId() + "\tThreadName: " + Thread.currentThread().getName() + "\t" + str + "\t" + str2); } if (!str.equals(str2)) { throw new RuntimeException( "date conversion failed after " + j + " iterations. Expected " + str + " but got " + str2); } } } catch (ParseException e) { throw new RuntimeException("parse failed"); } } }; new Thread(r[i]).start(); } } }
多次运行,便会出现异常错误:
java.lang.RuntimeException: date conversion failed after 0 iterations. Expected 01-Jan-1999 but got 28-Jul-2015
线程访问的情况大致如下图:
SimpleDateFormat 类内部有一个 Calendar 对象引用,它用来储存和这个 SimpleDateFormat 相关的日期信息,例如sdf.parse(dateStr), sdf.format(date) 诸如此类的方法参数传入的日期相关String, Date等等, 都是交给 Calendar 引用来储存的.这样就会导致一个问题,如果你的 SimpleDateFormat 是个static 的, 那么多个thread 之间就会共享这个SimpleDateFormat , 同时也是共享这个Calendar引用,那么就出现时间混乱的情况。
解决方法
(1)第一种方法,也是最简单的解决方案。我们可以把static去掉,这样每个新的线程都会有一个自己的sdf实例,从而避免线程安全的问题。
SimpleDateFormat df = new SimpleDateFormat("dd-MMM-yyyy", Locale.US); Date d = df.parse(str); str2 = df.format(d);
此时访问的情况如下:
然而,使用这种方法,在高并发的情况下会大量的new sdf以及销毁sdf,这样是非常耗费资源的。
(2)第二种方法,使用 ThreadLocal。
在并发情况下,网站的请求任务与线程执行情况大概可以理解为如下。
例如Tomcat的线程池的最大Thread数为4, 现在需要执行的任务有1000个(理解为有1000个用户点了你的网站的某个功能),而这1000个任务都会用到我们写的日期函数处理类
A) 假如说日期函数处理类使用的是new SimpleDateFormat的方法,那么这里就会有1000次sdf的创建和销毁
B) Java中提供了一种ThreadLocal的解决方案,它的工作方式是,每个线程只会有一个实例,也就是说我们执行完这1000个任务,总共只会实例化4个sdf.
而且,它并不会有多线程的并发问题。因为,单个线程执行任务肯定是顺序的,例如Thread #1负责执行Task #1-#250, 那么他是顺序而执行Task #1-#250,而Thread #2拥有自己的sdf实例,他也是顺序执行任务 Task #251-#500, 以此类推。
/* */ package org.bupt.xiaoye.chapter3; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import java.util.HashMap; import java.util.Map; public class DateUtil { /** 存放不同的日期模板格式的sdf的Map */ private static ThreadLocal<Map<String, SimpleDateFormat>> sdfMap = new ThreadLocal<Map<String, SimpleDateFormat>>() { @Override protected Map<String, SimpleDateFormat> initialValue() { System.out.println(Thread.currentThread().getName() + " init pattern: " + Thread.currentThread()); return new HashMap<String, SimpleDateFormat>(); } }; /** * 返回一个SimpleDateFormat,每个线程只会new一次pattern对应的sdf * * @param pattern * @return */ private static SimpleDateFormat getSdf(final String pattern) { Map<String, SimpleDateFormat> tl = sdfMap.get(); SimpleDateFormat sdf = tl.get(pattern); if (sdf == null) { System.out.println(Thread.currentThread().getName()+" put new sdf of pattern " + pattern + " to map"); sdf = new SimpleDateFormat(pattern); tl.put(pattern, sdf); } return sdf; } /** * 这样每个线程只会有一个SimpleDateFormat * * @param date * @param pattern * @return */ public static String format(Date date, String pattern) { return getSdf(pattern).format(date); } public static Date parse(String dateStr, String pattern) throws ParseException { return getSdf(pattern).parse(dateStr); } }
这里每个线程都有以 Thread 为key的 Map表,而这个表又以pattern 为key,每一个 pattern 都有一个唯一的 SimpleDateFormat 对象。
我们通过下面代码来测试:
package org.bupt.xiaoye.chapter3; import java.text.ParseException; import java.util.concurrent.ExecutorService; import java.util.concurrent.Executors; import java.util.concurrent.TimeUnit; public class Test { public static void main(String[] args) { final String patten1 = "yyyy-MM-dd"; final String patten2 = "yyyy-MM"; Thread t1 = new Thread() { @Override public void run() { try { DateUtil.parse("1992-09-13", patten1); } catch (ParseException e) { e.printStackTrace(); } } }; Thread t2 = new Thread() { @Override public void run() { try { DateUtil.parse("2000-09", patten2); } catch (ParseException e) { e.printStackTrace(); } } }; Thread t3 = new Thread() { @Override public void run() { try { DateUtil.parse("1992-09-13", patten1); } catch (ParseException e) { e.printStackTrace(); } } }; Thread t4 = new Thread() { @Override public void run() { try { DateUtil.parse("2000-09", patten2); } catch (ParseException e) { e.printStackTrace(); } } }; Thread t5 = new Thread() { @Override public void run() { try { DateUtil.parse("2000-09-13", patten1); } catch (ParseException e) { e.printStackTrace(); } } }; Thread t6 = new Thread() { @Override public void run() { try { DateUtil.parse("2000-09", patten2); } catch (ParseException e) { e.printStackTrace(); } } }; System.out.println("单线程执行: "); ExecutorService exec = Executors.newFixedThreadPool(1); exec.execute(t1); exec.execute(t2); exec.execute(t3); exec.execute(t4); exec.execute(t5); exec.execute(t6); exec.shutdown(); sleep(1000); System.out.println("双线程执行: "); ExecutorService exec2 = Executors.newFixedThreadPool(2); exec2.execute(t1); exec2.execute(t2); exec2.execute(t3); exec2.execute(t4); exec2.execute(t5); exec2.execute(t6); exec2.shutdown(); } private static void sleep(long millSec) { try { TimeUnit.MILLISECONDS.sleep(millSec); } catch (InterruptedException e) { e.printStackTrace(); } } }
单线程执行: pool-1-thread-1 init pattern: Thread[pool-1-thread-1,5,main] pool-1-thread-1 put new sdf of pattern yyyy-MM-dd to map pool-1-thread-1 put new sdf of pattern yyyy-MM to map 双线程执行: pool-2-thread-1 init pattern: Thread[pool-2-thread-1,5,main] pool-2-thread-1 put new sdf of pattern yyyy-MM-dd to map pool-2-thread-2 init pattern: Thread[pool-2-thread-2,5,main] pool-2-thread-2 put new sdf of pattern yyyy-MM to map pool-2-thread-1 put new sdf of pattern yyyy-MM to map pool-2-thread-2 put new sdf of pattern yyyy-MM-dd to map
从输出我们可以看出:
1) 1个线程执行这6个任务的时候,这个线程首次使用过的时候会new一个新的sdf,并且以后都一直用这个sdf,而不是每次处理任务都新建一个新的sdf
2) 2个线程执行6个任务的时候也是同理,但是2个线程的sdf是分开的,每个线程都有自己的"yyyy-MM-dd", "yyyy-MM"的sdf,所以他们不会有线程安全安全问题
试想,如果使用的是new的实现方法,那么不管是用1个线程去执行,还是用2个线程去执行这6个任务,都需要new 6个sdf
(3)第三种方式,使用同步代码块(synchronized)或者使用装饰器设计模式包装下 SimpleDateFormat ,使之变得线程安全。
也就是在另一篇文章中介绍的 实例封闭机制。
http://blog.csdn.net/zq602316498/article/details/40143437
(4)第四种方式,使用第三方日期处理函数
比如 JODA 来避免这些问题,你也可以使用 commons-lang 包中的 FastDateFormat 工具类。
参考博文:
http://my.oschina.net/leejun2005/blog/152253
http://www.cnblogs.com/zemliu/archive/2013/08/29/3290585.html