PHP之pcntl_fork多进程并发编程示例

待下载的网页地址放在$urls数组中,按指定的并发数多进程下载网页,下载的网页保存在本地硬盘,下载的网页大小通过linux消息队列发送给父进程累加,全部网页下载完成后,父进程显示下载的网页数、字节数。代码如下。

<?
//$urls数组用于保存要下载的网址,实际应用中一般从文件或数据库中读取网址保存到$urls中。
$urls = array(‘http://www.qq.com‘,‘http://www.sohu.com‘,‘http://www.sina.com.cn‘,....);
$urls_num = count($urls);//数组大小,也是网址数量
$msg_file = "/tmp/download_msgqueue.txt";//下面3行创建linux消息队列下,该文件须先创建好
$msg_queuekey = ftok($msg_file,‘R‘);//touch /tmp/download_msgqueue.txt
$msg_queue = msg_get_queue($msg_queuekey, 0666); 
$maxtasknum = 5;//设定并发进程数
$ct = 0;//$urls数组用的计数器
$cttask = 0;//并发进程计数器
$pids = array();//保存进程的数组
$total_bytes = 0;//下载网页的字节数
while ($ct<$urls_num) {//循环抓取$urls数组中指定的网页
while ($cttask<$maxtasknum && $ctproc<$urls_num) {//fork出指定的并发数进程
$pids[$ct] = pcntl_fork();
if ($pids[$ct]==-1) {
echo "create subproc fail.\n";
exit(0);
}
elseif ($pids[$ct]>0) {//父进程
}
elseif ($pids[$ct]==0) {//子进程
download($urls[$ct], $msg_queue);
exit(0);
}
$cttask++;
$ct++;
}
$tmppid = pcntl_waitpid(0, $status);//等待子进程结束
foreach($pids as $key => $pid) {
    if($tmppid == $pid){
    unset($pids[$key]);
    $cttask--;//子进程结束后,并发进程计数器减1
    }
}
do {//从消息队列出取出每个网页的大小,计算下载的字节数。如果要下载的网页很多,需要把此段代码放到下载网页的循环中,否则可能会出现队列满的情况。
msg_receive($msg_queue, 0, $message_type, 16, $message, true, MSG_IPC_NOWAIT); 
//echo "[".$message."]\n";
$total_bytes += $message;
$a = msg_stat_queue($msg_queue);
if($a[‘msg_qnum‘] == 0){//这种方式退出比$ct==$urls_num好,因为如果fork==-1,就不会有$urls_num个消息,程序会永远等待消息。
    break;
}
} while(true);
}
while ($cttask > 0) {//等待最后$cttask个子进程结束
$tmppid = pcntl_waitpid(0,$status);
foreach($pids as $key => $pid) {
    if($tmppid == $pid){
    unset($pids[$key]);
    $cttask--;
    }
}
}
do {//取得最后$cttask个子进程的消息
msg_receive($msg_queue, 0, $message_type, 16, $message, true, MSG_IPC_NOWAIT); 
//echo "[".$message."]\n";
$total_bytes += $message;
$a = msg_stat_queue($msg_queue);
if($a[‘msg_qnum‘] == 0){
    break;
}
} while(true);
msg_remove_queue($msg_queue);//删除消息队列
echo "\nDone. download: ".$urls_num." pages,total: ".round($total_bytes/1024,3)." KB \n";
exit(0);
function download($url, $msg_queue) {//下载指定网页,把内容保存在本地硬盘,并下载内容的长度放入消息队列中
$dirname = "/tmp/donwload/";//保存下载网页的目录,要事先创建好
$content = file_get_contents($url);
if ($content === false) {
$content = 0;
}
$url_parts = parse_url($url);
$fname = $dirname.$url_parts[‘host‘];
$ret = file_put_contents($fname, $content);
msg_send($msg_queue, 1, strlen($content));
} 
?>

参考资料:

PHP实现进程间通信:消息队列 https://www.douban.com/note/245520545/

时间: 2024-10-12 07:04:17

PHP之pcntl_fork多进程并发编程示例的相关文章

python多进程并发编程

Python提供了非常好用的多进程包multiprocessing,你只需要定义一个函数,Python会替你完成其他所有事情. 借助这个包,可以轻松完成从单进程到并发执行的转换. 一.单进程编程 如果我们新建少量进程,可以如下: import multiprocessing import time def func(msg): for i in xrange(3): print msg time.sleep(1) if __name__ == "__main__": p = multi

Go语言并发编程示例 分享(含有源代码)

GO语言并发示例分享: ppt http://files.cnblogs.com/files/yuhan-TB/GO%E8%AF%AD%E8%A8%80.pptx 代码, 实际就是<<Go语言程序设计>> (Mark Summerfield[英]著,许式伟 吕桂华 徐立 何李石 译) 第七章的全部示例: http://files.cnblogs.com/files/yuhan-TB/blog_go.tar.gz

Java并发编程示例代码-----ReentrantLock

public class ReenterLock implements Runnable{ public static ReentrantLock lock=new ReentrantLock(); public static int i=0; @Override public void run() { for(int j=0;j<10000000;j++){ lock.lock(); try{ i++; }finally{ lock.unlock(); } } } public static

Python3 与 C# 并发编程之~ 上篇

NetCore并发编程 示例代码:https://github.com/lotapp/BaseCode/tree/master/netcore/4_Concurrency 先简单说下概念(其实之前也有说,所以简说下): 并发:同时做多件事情 多线程:并发的一种形式 并行处理:多线程的一种(线程池产生的一种并发类型,eg:异步编程) 响应式编程:一种编程模式,对事件进行响应(有点类似于JQ的事件) Net里面很少用进程,在以前基本上都是线程+池+异步+并行+协程 我这边简单引入一下,毕竟主要是写P

Python3 加C# 并发编程!强强组合!会产生什么样的化学反应?

1.进程篇 官方文档:https://docs.python.org/3/library/multiprocessing.html 1.1.进程(Process) Python的进程创建非常方便,看个案例:(这种方法通用,fork只适用于Linux系) 进群:548377875   即可获取数十套PDF哦! 其他参数可以参考源码 or 文档,贴一下源码的 init方法: def__init__(self,group=None,target=None,name=None,args=(),kwarg

Cpython解释器下实现并发编程——多进程、多线程、协程、IO模型

一.背景知识 进程即正在执行的一个过程.进程是对正在运行的程序的一个抽象. 进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重要的抽象概念之一.操作系统的其他所有内容都是围绕进程的概念展开的.   一.操作系统相关的知识 详情见链接:http://www.cnblogs.com/linhaifeng/p/6295875.html 即使可以利用的CPU只有一个(早期的计算机确实如此),也能保证支持(伪)并发的能力.将一个单独的CPU变成多个虚拟的CPU(多道技术:时

Python 3 并发编程多进程之队列(推荐使用)

Python 3 并发编程多进程之队列(推荐使用) 进程彼此之间互相隔离,要实现进程间通信(IPC),multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的. 可以往队列里放任意类型的数据 创建队列的类(底层就是以管道和锁定的方式实现): 1 Queue([maxsize]):创建共享的进程队列,Queue是多进程安全的队列,可以使用Queue实现多进程之间的数据传递. 参数介绍: 1 maxsize是队列中允许最大项数,省略则无大小限制. 方法介绍: 1.主要

Python 3 并发编程多进程之进程同步(锁)

Python 3 并发编程多进程之进程同步(锁) 进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,竞争带来的结果就是错乱,如何控制,就是加锁处理. 1.多个进程共享同一打印终端 from multiprocessing import Process import os,time def work(): print('%s is running' %os.getpid()) time.sleep(2) print('%s is done' %os.g

python并发编程之多进程

python并发编程之多进程 一.什么是进程 进程:正在进行的一个过程或者一个任务,执行任务的是CPU. 原理:单核加多道技术 二.进程与程序的区别 进程是指程序的运行过程 需要强调的是:同一个程序执行两次是两个进程,比如打开暴风影音,虽然都是同一个软件,但是一个可以播放苍井空,另一个可以播放武藤兰. 三.并发与并行 无论是并行还是并发,在用户看来都是'同时'运行的,不管是进程还是线程,都只是一个任务而已,真是干活的是cpu,cpu来做这些任务,而一个cpu同一时刻只能执行一个任务. (1)并发