python\进程和线程3

1 multiprocessing模块

（1.）直接导入
from multiprocessing import Process
import os
import time
def info(name):
    print("name:",name)
    print(‘parent process:‘, os.getppid())
    print(‘process id:‘, os.getpid())
    print("------------------")
def foo(name):
    info(name)
    time.sleep(50)
if __name__ == ‘__main__‘:
    info(‘main process line‘)
    p1 = Process(target=info, args=(‘alvin‘,))
    p2 = Process(target=foo, args=(‘egon‘,))
    p1.start()
    p2.start()

    p1.join()
    p2.join()

    print("ending")
time.sleep(100)
>>
name: main process line
parent process: 16976
process id: 18456
------------------
name: alvin
parent process: 18456
process id: 19884
------------------
name: egon
parent process: 18456
process id: 19112
------------------
ending

（2．）创建类的方法

构造方法：

Process([group [, target [, name [, args [, kwargs]]]]])

　　group: 线程组，目前还没有实现，库引用中提示必须是None；

　　target: 要执行的方法；

　　name: 进程名；

args/kwargs: 要传入方法的参数。

实例方法：

　　is_alive()：返回进程是否在运行。

　　join([timeout])：阻塞当前上下文环境的进程程，直到调用此方法的进程终止或到达指定的timeout（可选参数）。

　　start()：进程准备就绪，等待CPU调度

　　run()：strat()调用run方法，如果实例进程时未制定传入target，这star执行t默认run()方法。

　　terminate()：不管任务是否完成，立即停止工作进程

属性：

　　daemon：和线程的setDeamon功能一样

　　name：进程名字。

　　pid：进程号。

2 协程

协程的优点：

（1）由于单线程不存在切换

（2）不再有任何锁的概念

yield是最基本的携程函数
没有办法监听到IO，进行切换
可以保存到数据的状态通过send方法来运行
import time
# 注意到consumer函数是一个generator（生成器）:
# 任何包含yield关键字的函数都会自动成为生成器(generator)对象

def consumer():
    r = ‘‘
    while True:
        n = yield r
        if not n:
            return
        print(‘[CONSUMER] ←← Consuming %s...‘ % n)
        time.sleep(1)
        r = ‘200 OK‘
def produce(c):
    # 1、首先调用c.next()启动生成器
    next(c)
    n = 0
    while n < 5:
        n = n + 1
        print(‘[PRODUCER] →→ Producing %s...‘ % n)
        # 2、然后，一旦生产了东西，通过c.send(n)切换到consumer执行；
        cr = c.send(n)
        # 4、produce拿到consumer处理的结果，继续生产下一条消息；
        print(‘[PRODUCER] Consumer return: %s‘ % cr)
    # 5、produce决定不生产了，通过c.close()关闭consumer，整个过程结束。
    c.close()
if __name__==‘__main__‘:
    # 6、整个流程无锁，由一个线程执行，produce和consumer协作完成任务，所以称为“协程”，而非线程的抢占式多任务。
    c = consumer()
    produce(c)

greenlet模块

可以实现手动切换

调用属性swich

gevent可以实现IO的监听

gevent.joinall 开启所有程序

gevent.spawn 切换

3 IO模型

IO指input, output

IO发生时涉及的对象和步骤

会涉及到两个系统对象，一个是调用这个IO的process(or thread)，另一个就是系统内核(kernel)。当一个操作发生时，会经历两个阶段：

（1）等待数据准备

（2）将数据从内核拷贝到进程中

IO模型类型：

1. 阻塞 IO

1. 非阻塞 IO

非阻塞IO：发送多次系统调用

优点：wait for data无阻塞

缺点：系统调用太多

不能及时拿到数据

两个阶段：wait for data非阻塞

copy data 阻塞

非阻塞的recvform系统调用调用之后，进程并没有被阻塞，内核马上返回给进程，如果数据还没准备好，此时会返回一个error。进程在返回之后，可以干点别的事情，然后再发起recvform系统调用。重复上面的过程，循环往复的进行recvform系统调用。这个过程通常被称之为轮询。轮询检查内核数据，直到数据准备好，再拷贝数据到进程，进行数据处理。需要注意，拷贝数据整个过程，进程仍然是属于阻塞的状态。

1. IO多路复用（监听多个链接）

特点：（1）全程阻塞

能监听多个文件描述符实现并发

#服务端

import select

import socket

sock=socket.socket()#产生一个套接字

sock.bind(("127.0.0.1",8080))

sock.listen(5)

sock.setblocking(False)

inputs=[sock,]

while 1:

    r,w,e=select.select(inputs,[],[])#监听有变化的套接字sock

    #wait for data

    for obj in r:

        if obj==sock:

            conn,addr=obj.accept()#从内核copy信息到用户态

            print("conn",conn)

            inputs.append(conn)#监听列表添加客户conn

        else:

            data=obj.recv(1024)#接收信息

            print(data.decode("utf8"))

            send_data=input(">>")#发送信息

            obj.send(send_data.encode("utf8"))

#客户端

import socket

sock=socket.socket()

sock.connect(("127.0.0.1",8080))

while 1:

    data=input("input>>")

    sock.send(data.encode("utf8"))

    recv_data=sock.recv(1024)

    print(recv_data.decode("utf8"))

sock.close()

对于文件描述符（套接字对象）

(1) 是一个非零整数，不会变

(2) 收发数据的时候，对于接收端而言，数据先到内核空间，然后copy到用户空间，同时，内核空间数据清除

1. 异步IO

全程无阻塞

5.驱动信号

小结：

有阻塞blocking

无阻塞non-blocking

调用blocking IO会一直block住对应的进程知道操作完成

non-blocking IO在kernel还准备数据的情况下会立刻返回

有阻塞是同步阻塞：阻塞 非阻塞 IO多路复用

无阻塞是异步阻塞：异步IO

4 selectors模块

IO多路复用实现机制

Win:select

Linux:select,poll,epoll

Select缺点：1.每次调用select都要将所有的fd(文件描述符)拷贝到内核空间，导致效率下降

2.遍历所有的fd，是否有数据访问（最重要的问题）

3.最大连接数（1024）

poll:最大连接数没有限制

epoll:1.第一个函数创建epoll句柄，将所有的fd(文件描述符)拷贝到内核空间

只需要拷贝一次

2.回调函数：某一个函数或者某一个动作成功完成之后会触发的函数

为所有的fd绑定一个回调函数，但有数据访问触发该回调函数

回调函数将fd放到列表中

import selectors
import socket
sock=socket.socket()
sock.bind(("127.0.0.1",8080))
sock.listen(5)
sock.setblocking(False)
sel=selectors.DefaultSelector()#根据具体平台选择最佳IO多路机制
def read(conn,mask):
    try:
        data=conn.recv(1024)
        print(data.decode("utf8"))
        data2=input(">>")
        conn.send(data2.encode("utf8"))
    except Exception:
        sel.unregister(conn)
def accept(sock,mask):
    sel.register(sock,selectors.EVENT_READ,accept)
    conn,addr=sock.accept()
    sel.register(conn,selectors.EVENT_READ,read)
sel.register(sock,selectors.EVENT_READ,accept)#注册功能
while 1:
    events=sel.select()
    for key,mask in events:
        print(key.data)#定义的函数
        print(key.fileobj)#socket对象
        func=key.data
        obj=key.fileobj
        func(obj,mask)

break

import socket
sock=socket.socket()
sock.connect(("127.0.0.1",8080))
while 1:
    data=input("input>>")
    sock.send(data.encode("utf8"))
    recv_data=sock.recv(1024)
    print(recv_data.decode("utf8"))

sock.close()

5. 队列

队列用在多线程，多进程中，用来保护数据

队列是个数据类型

优点：线程安全

import queue
q=queue.Queue(3)#默认是先进先出
q.put(111)
q.put("hello")
q.put(222)
print(q.get())
print(q.get())
print(q.get())
>>
111
hello
222

import queue
q=queue.Queue(3)#默认是先进先出
q.put(111)
q.put("hello")
q.put(222)
q.put(223,False)#q=queue.Queue(3)队列定义只能放3个值，
# #超过限额时，返回错误信息
print(q.get())
print(q.get())
print(q.get())

q.get()#没有数据的时候不会报错，只会等待
q.get(False)#数据为空，报错

先进后出
import queue
q=queue.LifoQueue()
q.put(111)
q.put(5)
q.put(43)
print(q.get())

优先级
import queue
q=queue.PriorityQueue()
q.put([4,"hello"])
q.put([1,"hello5"])
print(q.get())

时间： 2024-12-18 17:54:36

python\进程和线程3

1 multiprocessing模块

2 协程

3 IO模型

4 selectors模块

5. 队列

python\进程和线程3的相关文章

Python编程（二）：Python进程、线程那点事儿

python 进程、线程（二）

python\进程和线程2

python进程、线程、协程

Python进程与线程及GIL（全局解释器锁）

Python进程、线程、协程详解

[ Python - 14 ] python进程及线程编程

Python 进程、线程、协程、锁机制，你知多少？

python进程、线程、协程以及几种自定义线程池

Python进程与线程