python多进程的理解 multiprocessing Process join run

最近看了下多进程。

一种接近底层的实现方法是使用
os.fork()方法，fork出子进程。但是这样做事有局限性的。比如windows的os模块里面没有 fork()
方法。

windows：。linux：

另外还有一个模块：subprocess。这个没整过，但从vamei的博客里看到说也同样有局限性。

所以直接说主角吧 --- multiprocessing模块。
multiprocessing模块会在windows上时模拟出fork的效果，可以实现跨平台，所以大多数都使用multiprocessing。

下面给一段简单的代码，演示一下创建进程：

#encoding:utf-8

from multiprocessing import Process

import os, time, random
#线程启动后实际执行的代码块

def r1(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())


def r2(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())
if __name__ == "__main__":

        print "main process run..."

        p1 = Process(target=r1, args=(‘process_name1‘, ))       #target:指定进程执行的函数，args:该函数的参数，需要使用tuple

        p2 = Process(target=r2, args=(‘process_name2‘, ))
p1.start()    #通过调用start方法启动进程，跟线程差不多。

        p2.start()    #但run方法在哪呢？待会说。。。

        p1.join()     #join方法也很有意思，寻思了一下午，终于理解了。待会演示。

        p2.join()

        print "main process runned all lines..."

执行结果：

上面提到了两个方法：run 和join

run：如果在创建Process对象的时候不指定target，那么就会默认执行Process的run方法：

#encoding:utf-8

from multiprocessing import Process

import os, time, random
def r():

    print ‘run method‘
if __name__ == "__main__":

        print "main process run..."

        #没有指定Process的targt

        p1 = Process()

        p2 = Process()

        #如果在创建Process时不指定target，那么执行时没有任何效果。因为默认的run方法是判断如果不指定target，那就什么都不做

        #所以这里手动改变了run方法

        p1.run = r

        p2.run = r
p1.start()

        p2.start()

        p1.join()

        p2.join()

        print "main process runned all lines..."

另：python源码里，Process.run方法：

执行结果：

可见如果在实例化Process时不指定target，就会执行默认的run方法。

还有一个join方法：

最上面演示的代码中，在调用Process的start方法后，调用了两次join方法。这个join方法是干什么的呢？

官方文档的意思是：阻塞当前进程，直到调用join方法的那个进程执行完，再继续执行当前进程。

比如还是刚才的代码，只是把两个join注释掉了：

#encoding:utf-8

from multiprocessing import Process

import os, time, random
def r1(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

def r2(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())
if __name__ == "__main__":

        print "main process run..."

        p1 = Process(target=r1, args=(‘process_name1‘, ))

        p2 = Process(target=r2, args=(‘process_name2‘, ))
p1.start()

        p2.start()

        #p1.join()
        #p2.join()

        print "main process runned all lines..."

执行结果：

发现主进程不像之前那样，等待两个子进程执行完了，才继续执行。而是启动两个进程后立即向下执行。

为了深刻理解，这次把p2的执行函数里面睡眠时间调大，让他多睡一会，然后保留p1的join，注释掉p2的join，效果更明显：

#encoding:utf-8

from multiprocessing import Process

import os, time, random
def r1(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

def r2(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random()*2)
if __name__ == "__main__":

        print "main process run..."

        p1 = Process(target=r1, args=(‘process_name1‘, ))

        p2 = Process(target=r2, args=(‘process_name2‘, ))
p1.start()

        p2.start()

        p1.join()

        #p2.join()

        print "main process runned all lines..."

执行结果：

发现主线程只是等待p1完成了，就会向下执行，而不会等待p2是否完成。

所以使用多进程的常规方法是，先依次调用start启动进程，再依次调用join要求主进程等待子进程的结束。

然而为什么要先依次调用start再调用join，而不是start完了就调用join呢，如下：

由：

p1.start()

p2.start()

p1.join()

改为：

p1.start()

p1.join()

p2.start()

执行效果：

发现是先执行完p1，再执行主线程，最后才开始p2。

今天上午一直困惑这个事，现在终于明白了。join是用来阻塞当前线程的，p1.start()之后，p1就提示主线程，需要等待p1结束才向下执行，那主线程就乖乖的等着啦，自然没有执行p2.start()这一句啦，当然就变成了图示的效果了。

python多进程的理解 multiprocessing Process join run,布布扣,bubuko.com

时间： 2024-08-06 11:57:59

python多进程的理解 multiprocessing Process join run的相关文章

Python多进程multiprocessing使用示例

mutilprocess简介像线程一样管理进程,这个是mutilprocess的核心,他与threading很是相像,对多核CPU的利用率会比threading好的多. import multiprocessing def worker(num): """thread worker function""" print 'Worker:', num return if __name__ == '__main__': jobs = [] for i

创建一个多进程（multiprocessing.Process）

进程是资源的集合,每个进程至少包含一个线程 import multiprocessing #导入进程模块import time, threading #导入线程 def thread_run(): print(threading.get_ident())def run(name): time.sleep(2) print('hello', name) t = threading.Thread(target=thread_run) #创建一个线程 t.start() if __name__ ==

python:多进程，多进程队列，多进程管道,Manager,进程锁,进程池

#!usr/bin/env python# -*- coding:utf-8 -*- __author__ = "Samson" import multiprocessingimport time def run(name): time.sleep(2) print("process start...%s" % name)if __name__ == "__main__": for i in range(10): p = multiprocess

Python 多进程编程之multiprocessing--Process

Python 多进程编程之multiprocessing 1,Process 跨平台的进程创建模块(multiprocessing), 支持跨平台:windowx/linux 创建和启动创建格式:p=Process(target=函数名)----def __init__(self, group=None, target=None, name=None, args=(), kwargs={}):group:分组(基本不用)target:表示这个进程实例所调用的对象.name:给进程起一

python多进程详解

1.由于python多线程适合于多IO操作,但不适合于cpu计算型工作,这时候可以通过多进程实现.python多进程简单实用 # 多进程,可以cpu保持一致,python多线程适合多io.对于高cpu的可以通过多进程实现. import multiprocessing import time def run(name): print(" %s process is running "%(name)) time.sleep(2) if __name__ == '__main__': fo

Python 多进程实战 & 回调函数理解与实战

这篇博文主要讲下笔者在工作中Python多进程的实战运用和回调函数的理解和运用. 多进程实战实战一.批量文件下载从一个文件中按行读取 url ,根据 url 下载文件到指定位置,用多进程实现. #!/usr/local/python27/bin/python2.7 from multiprocessing import Process,Pool import os,time,random,sys import urllib # 文件下载函数 def filedown(url,file):

Python多进程（multiprocessing）

Unix/Linux操作系统提供了一个fork()系统调用,它非常特殊.普通的函数调用,调用一次,返回一次,但是fork()调用一次,返回两次,因为操作系统自动把当前进程(称为父进程)复制了一份(称为子进程),然后,分别在父进程和子进程内返回. 子进程永远返回0,而父进程返回子进程的ID.这样做的理由是,一个父进程可以fork出很多子进程,所以,父进程要记下每个子进程的ID,而子进程只需要调用getppid()就可以拿到父进程的ID. Python的os模块封装了常见的系统调用,其中就包括for

Python多进程（multiprocessing）学习总结

简介 multiprocessing模块使用和threading包类似的API接口来产生多进程,multiprocessing包提供本地和远程的并发,通过使用subprocesses(子进程)代替threads(线程)有效的避开了GIL(Global Interpreter Lock).由于这一点,multiprocessing模块允许程序充分的利用多处理器.可以跨平台使用,包括Unix和Windows!----https://docs.python.org/2/library/multipro

Python多进程并发(multiprocessing)用法实例详解

http://www.jb51.net/article/67116.htm 本文实例讲述了Python多进程并发(multiprocessing)用法.分享给大家供大家参考.具体分析如下: 由于Python设计的限制(我说的是咱们常用的CPython).最多只能用满1个CPU核心.Python提供了非常好用的多进程包multiprocessing,你只需要定义一个函数,Python会替你完成其他所有事情.借助这个包,可以轻松完成从单进程到并发执行的转换. 1.新建单一进程如果我们新建少量进程,