论线程池的线程粒度划分与深浅放置

摘要:多线程任务处理对提高性能很有帮助,在Java中提供的线程池也方便了对多线程任务的实现。使用它很简单,而如果进行了不正确的使用,那么代码将陷入一团乱麻。因此如何正确地使用它,如以下分享,这个技能你get到没?

关键词:多线程, 线程池, 数据库, 算法

解决问题:如何正确使用线程池。


众所周知,线程池在Java中非常常用,使用它也是一项最基本的技能。不过怎样才能更合理、更方便地使用线程池,我们需要总结一下。

下面是线程池最基础的使用方式。

ExecutorService jobPool = Executors.newFixedThreadPool(10);
while(true){
Job_anqi job_anqi = new GetData_anqi();
job_anqi.setParm(parm);
jobPool.submit(job_anqi);
}

可以从以上代码看出,产生了很多个job,我们不想按顺序完成它们,它们之间也没有任何的关系,因此“分布式任务”、mapReduce?现在还太早,步子跨太大容易扯着蛋,先把单机的多任务给完成吧。所以,我们创建了一个线程池,在循环中,不断地把job填充进去,这个线程池不大,只能容纳10个线程同时跑,其它的线程放进去后就得老老实实地排队等待。

当然这里只是一个简单的Demo,虽然它包含了“向各线程传入参数”这样东西,更复杂的还有“在主线程中获取各线程结果的返回值”。

  1. ExecutorService executorService =Executors.newCachedThreadPool();
    List<Future<String>> resultList =newArrayList<Future<String>>();
    // 创建10个任务并执行
    for(int i =0; i <10; i++){
    // 使用ExecutorService执行Callable类型的任务,并将结果保存在future变量中
    Future<String> future = executorService.submit(newTaskWithResult(i));
    // 将任务执行结果存储到List中
    resultList.add(future);
    }
    executorService.shutdown();
    // 遍历任务的结果
    for(Future<String> fs : resultList){
    try{
    System.out.println(fs.get());// 打印各个线程(任务)执行的结果,其中会偶尔抛出异常
    }catch(InterruptedException e){
    e.printStackTrace();
    }catch(ExecutionException e){
    executorService.shutdownNow();//某一线程发生异常时,关闭线程池
    e.printStackTrace();
    return;
    }
    }

上面这段代码不仅用到了多线程取结果值的方法,还有另外的功能:在执行某一项job时,若其发生了异常,则会连带关闭其他运行在此线程池上的所有线程。这有时是很有用的。

到目前为止,以上讨论的还停留在线程池的使用方法上。然而,现在的问题不是如何使用线程池,那太low了不是。当前的问题是,如何控制job的深浅,如何决定job的深浅。当你有很多任务要放在线程池中时,他们可能有各种不同的组织形式,相对的也就有不同的实现办法。例如:1、线程们可以按天来划分,每天起一个线程,多少天就起多少个线程丢在里面;2、同时,线程们也可以按数据形式来划分,每一种数据形式起一个线程,有多少种数据形式就开多少个线程;3、再者,线程干脆按粒度来划分,我每一千个数据批次包装成一个线程,无论天、无论数据形式,只是每千条数据一个线程地跑;4、甚至,你可以线程池中套线程池,每天一个线程,再在每天的数据里对每种数据形式开一个线程,再在每种数据形式里每千条数据一个线程地跑。这就有很复杂的场景了。

那么该如何选择使用哪一种划分线程的方式呢?我们来慢慢分析。

方案3是最常会想起的划分线程池办法,此办法划分的线程粒度最细,线程池放置的位置最深,也最方便。当然从理论上来说方案3跟其他方案一样执行起来不会有问题,所有的任务执行完毕后能够与其他方案得到同样的结果。可是,一旦我们有特殊需求时,它是不实用的。如果,你需要打印日志或者记录程序执行状态,比如说我要按天记录该天任务执行的如何,那么选择使用方案1是非常合适的,如果性能还不行,还可以选择使用方案4。因为在方案1和方案4中都可以知道该天的任务何时执行完毕。若是使用方案2,则不清楚每天的任务执行情况,因此无法实现记录;使用方案3,因为它的线程池放置位置太深,更是无法实现按天记录。

要实现记录任务的执行状态,那就需要对线程池进行把控,不可能将所有的任务提交到线程池中就不管了。下面是最常见的监视线程池中所有的线程是否执行完毕的代码段。

  1. ExecutorService jobPool =Executors.newFixedThreadPool(10);
    while(true){
    Job_anqi job_anqi =newGetData_anqi();
    job_anqi.setParm(parm);
    jobPool.submit(job_anqi);
    }
    pool.shutdown();
    try{
    while(!jobPool.isTerminated()){
    Thread.sleep(1000);
    }
    }catch(InterruptedException e){
    e.printStackTrace();
    }
    logger.info("angel wang 做完了所有的工作, Good job!");

可以看到,把所有的job都提交完后,就要起个while循环来监听这个线程池,每隔一秒去问一下所有的线程是不是都跑完了。在得到肯定的答复后,就可以说,"angel wang 做完了所有的工作, Good job!"了。

综上所述,创建线程池的位置很重要,它直接决定了划分线程的粒度,而线程的粒度是需要你来把控的。

PS:java.sql.Connection是非线程安全的,各线程间不能对同一个Connection实例进行操作,不然对数据库的操作会乱掉。但也要注意,如果需要启动多线程对同一个数据库进行操作,每个线程要使用其自身创建的Connection实例来连接并操作数据库,如果不加限制的话,那么对该数据库建立的连接数会过多,导致建立连接不成功。因此,要么在数据库连接池中配置最多可以创建的连接数,要么控制创建出的线程个数,进行连接池配置要方便及容易许多。这也是数据库连接池如:Druid、DBCP、C3P0存在的意义之一。

最近换了城市,换了份工作,进入互联网公司,遇到了很多之前没有遇到过的问题,技术上的、管理上的、沟通上的......。体会下来,真是家家有本难念的经啊,无限烧脑中。但是兵来将挡水来土掩嘛,有什么问题解决什么问题。

来自王安琪

时间: 2024-10-09 12:30:40

论线程池的线程粒度划分与深浅放置的相关文章

线程系列06,通过CLR代码查看线程池及其线程

在"线程系列04,传递数据给线程,线程命名,线程异常处理,线程池"中,我们已经知道,每个进程都有一个线程池.可以通过TPL,ThreadPool.QueueUserWorkItem,委托与线程池交互.本篇体验:通过查看CLR代码来观察线程池及其线程. □ 通过编码查看线程池和线程 使用ThreadPool的静态方法QueueUserWorkItem把线程放入线程池,来看线程池线程和主程序线程的执行情况. class Program { static void Main(string[]

线程池和线程的选择

能用线程池就用线程池,线程池效率比线程高很多. 线程池处理线程的顺序不一定. 线程池不能手动关闭具体线程. 如果执行线程时间特别长,那手动创建线程,和放入线程池中没太大区别. 线程池非常适合做大量的小的运算.

多线程 线程池 守护线程

守护线程只是个概念问题,一句话可以总结(不知道总结的对不对^_^); 当所有用户线程都结束的时候,守护线程也就结束了,当有用户线程存在的时候,守护线程就是一个普通线程. main线程不可以设置成守护线程,应为只有在线程调用start方法前,才可以设置线程为守护线程,main线程是jvm创建的 多线程以及线程池的问题 import java.io.DataInputStream; import java.io.File; import java.io.FileOutputStream; impor

通过实验研究“线程池中线程数目的变化规律” --- 下有不错的线程池使用 原理 总结

通过实验研究“线程池中线程数目的变化规律” 自从看了老赵关于线程池的实验以后,我就想学着做一个类似的实验,验证自己的理解,现在终于做好了,请大家指正. 一般情况下我们都使用Thread类创建线程,因为通过Thread对象可以对线程进行灵活的控制.但创建线程和销毁线程代价不菲,过多的线程会消耗掉大量的内存和CPU资源,假如某段时间内突然爆发了100个短小的线程,创建和销毁这些线程就会消耗很多时间,可能比线程本身运行的时间还长.为了改善这种状况,.NET提供了一种称之为线程池(Thread Pool

Python的并发并行[4] -&gt; 并发 -&gt; 利用线程池启动线程

利用线程池启动线程 submit与map启动线程 利用两种方式分别启动线程,同时利用with上下文管理来对线程池进行控制 1 from concurrent.futures import ThreadPoolExecutor as tpe 2 from concurrent.futures import ProcessPoolExecutor as ppe 3 from time import ctime, sleep 4 from random import randint 5 6 def f

由浅入深理解Java线程池及线程池的如何使用

前言 多线程的异步执行方式,虽然能够最大限度发挥多核计算机的计算能力,但是如果不加控制,反而会对系统造成负担.线程本身也要占用内存空间,大量的线程会占用内存资源并且可能会导致Out of Memory.即便没有这样的情况,大量的线程回收也会给GC带来很大的压力. 为了避免重复的创建线程,线程池的出现可以让线程进行复用.通俗点讲,当有工作来,就会向线程池拿一个线程,当工作完成后,并不是直接关闭线程,而是将这个线程归还给线程池供其他任务使用. 接下来从总体到细致的方式,来共同探讨线程池. 总体的架构

根据CPU核心数确定线程池并发线程数

转载:https://blog.csdn.net/FAw67J7/article/details/79885842 目录 一.抛出问题 二.分析 三.实际应用 四.总结: 正文 回到顶部 一.抛出问题 关于如何计算并发线程数,一般分两派,来自两本书,且都是好书,到底哪个是对的?问题追踪后,整理如下: 第一派:<Java Concurrency in Practice>即<java并发编程实践>,如下图: 如上图,在<Java Concurrency in Practice&g

Java多线程系列 JUC线程池07 线程池原理解析(六)

 关闭“线程池” shutdown()的源码如下: public void shutdown() { final ReentrantLock mainLock = this.mainLock; // 获取锁 mainLock.lock(); try { // 检查终止线程池的“线程”是否有权限. checkShutdownAccess(); // 设置线程池的状态为关闭状态. advanceRunState(SHUTDOWN); // 中断线程池中空闲的线程. interruptIdleWork

Java并发(八)计算线程池最佳线程数

目录 一.理论分析 二.实际应用 为了加快程序处理速度,我们会将问题分解成若干个并发执行的任务.并且创建线程池,将任务委派给线程池中的线程,以便使它们可以并发地执行.在高并发的情况下采用线程池,可以有效降低线程创建释放的时间花销及资源开销,如不使用线程池,有可能造成系统创建大量线程而导致消耗完系统内存以及“过度切换”(在JVM中采用的处理机制为时间片轮转,减少了线程间的相互切换) . 但是有一个很大的问题摆在我们面前,即我们希望尽可能多地创建任务,但由于资源所限我们又不能创建过多的线程.那么在高