PHP协程初体验

PHP协程初体验

By warezhou 2014.11.24

上次通过C扩展为PHP添加coroutine尝试失败之后,由于短期内啃下Zend可能性几乎为零,只能打语言原生能力的主意了。Google之后发现,PHP5.5引入了Generator和Coroutine新特性,于是才有了本文的诞生。

背景阅读

《当C/C++后台开发遇上Coroutine》

http://blog.csdn.net/cszhouwei/article/details/14230529

《一次失败的PHP扩展开发之旅》

http://blog.csdn.net/cszhouwei/article/details/41290673

预备知识

Generator

function my_range($start, $end, $step = 1) {
    for ($i = $start; $i <= $end; $i += $step) {
        yield $i;
    }
}

foreach (my_range(1, 1000) as $num) {
    echo $num, "\n";
}
/*
 * 1
 * 2
 * ...
 * 1000
 */

图 1 基于generator的range()实现

$range = my_range(1, 1000);

var_dump($range);
/*
 * object(Generator)#1 (0) {
 * }
 */

var_dump($range instanceof Iterator);
/*
 * bool(true)
 */

图 2 my_range()的实现推测

由于接触PHP时日尚浅,并未深入语言实现细节,所以只能根据现象进行猜测,以下是我的一些个人理解:

  • 包含yield关键字的函数比较特殊,返回值是一个Generator对象,此时函数内语句尚未真正执行
  • Generator对象是Iterator接口实例,可以通过rewind()、current()、next()、valid()系列接口进行操纵
  • Generator可以视为一种“可中断”的函数,而yield构成了一系列的“中断点”
  • Generator类似于车间生产的流水线,每次需要用产品的时候才从那里取一个,然后这个流水线就停在那里等待下一次取操作

Coroutine

细心的读者可能已经发现,截至目前,其实Generator已经实现了Coroutine的关键特性:中断执行、恢复执行。按照《当C/C++后台开发遇上Coroutine》的思路,借助“全局变量”一类语言设施进行信息传递,实现异步Server应该足够了。

其实相对于swapcontext族函数,Generator已经前进了一大步,具备了“返回数据”的能力,如果同时具备“发送数据”的能力,就再也不必通过那些蹩脚的手法绕路而行了。在PHP里面,通过Generator的send()接口(注意:不再是next()接口),可以完成“发送数据”的任务,从而实现了真正的“双向通信”。

function gen() {
    $ret = (yield 'yield1');
    echo "[gen]", $ret, "\n";
    $ret = (yield 'yield2');
    echo "[gen]", $ret, "\n";
}

$gen = gen();
$ret = $gen->current();
echo "[main]", $ret, "\n";
$ret = $gen->send("send1");
echo "[main]", $ret, "\n";
$ret = $gen->send("send2");
echo "[main]", $ret, "\n";

/*
 * [main]yield1
 * [gen]send1
 * [main]yield2
 * [gen]send2
 * [main]
 */

图 3 Coroutine双向通信示例

作为C/C++系码农,发现“可重入”、“双向通信”能力之后,貌似没有更多奢求了,不过PHP还是比较慷慨,继续添加了Exception机制,“错误处理”机制得到进一步完善。

function gen() {
    $ret = (yield 'yield1');
    echo "[gen]", $ret, "\n";
    try {
        $ret = (yield 'yield2');
        echo "[gen]", $ret, "\n";
    } catch (Exception $ex) {
        echo "[gen][Exception]", $ex->getMessage(), "\n";
    }
    echo "[gen]finish\n";
}

$gen = gen();
$ret = $gen->current();
echo "[main]", $ret, "\n";
$ret = $gen->send("send1");
echo "[main]", $ret, "\n";
$ret = $gen->throw(new Exception("Test"));
echo "[main]", $ret, "\n";

/*
 * [main]yield1
 * [gen]send1
 * [main]yield2
 * [gen][Exception]Test
 * [gen]finish
 * [main]
 */

图 4 Coroutine错误处理示例

实战演习

前面简单介绍了相关的语言设施,那么具体到实际项目中,到底应该如何运用呢?让我们继续《一次失败的PHP扩展开发之旅》描述的场景,借助上述特性实现那个美好的愿望:以同步方式书写异步代码!

第一版初稿

<?php

class AsyncServer {
    protected $handler;
    protected $socket;
    protected $tasks = [];

    public function __construct($handler) {
        $this->handler = $handler;

        $this->socket = socket_create(AF_INET, SOCK_DGRAM, SOL_UDP);
        if(!$this->socket) {
            die(socket_strerror(socket_last_error())."\n");
        }
        if (!socket_set_nonblock($this->socket)) {
            die(socket_strerror(socket_last_error())."\n");
        }
        if(!socket_bind($this->socket, "0.0.0.0", 1234)) {
            die(socket_strerror(socket_last_error())."\n");
        }
    }

    public function Run() {
        while (true) {
            $reads = array($this->socket);
            foreach ($this->tasks as list($socket)) {
                $reads[] = $socket;
            }
            $writes = NULL;
            $excepts= NULL;
            if (!socket_select($reads, $writes, $excepts, 0, 1000)) {
                continue;
            }

            foreach ($reads as $one) {
                $len = socket_recvfrom($one, $data, 65535, 0, $ip, $port);
                if (!$len) {
                    //echo "socket_recvfrom fail.\n";
                    continue;
                }
                if ($one == $this->socket) {
                    //echo "[Run]request recvfrom succ. data=$data ip=$ip port=$port\n";
                    $handler = $this->handler;
                    $coroutine = $handler($one, $data, $len, $ip, $port);
                    $task = $coroutine->current();
                    //echo "[Run]AsyncTask recv. data=$task->data ip=$task->ip port=$task->port timeout=$task->timeout\n";
                    $socket = socket_create(AF_INET, SOCK_DGRAM, SOL_UDP);
                    if(!$socket) {
                        //echo socket_strerror(socket_last_error())."\n";
                        $coroutine->throw(new Exception(socket_strerror(socket_last_error()), socket_last_error()));
                        continue;
                    }
                    if (!socket_set_nonblock($socket)) {
                        //echo socket_strerror(socket_last_error())."\n";
                        $coroutine->throw(new Exception(socket_strerror(socket_last_error()), socket_last_error()));
                        continue;
                    }
                    socket_sendto($socket, $task->data, $task->len, 0, $task->ip, $task->port);
                    $this->tasks[$socket] = [$socket, $coroutine];
                } else {
                    //echo "[Run]response recvfrom succ. data=$data ip=$ip port=$port\n";
                    if (!isset($this->tasks[$one])) {
                        //echo "no async_task found.\n";
                    } else {
                        list($socket, $coroutine) = $this->tasks[$one];
                        unset($this->tasks[$one]);
                        socket_close($socket);
                        $coroutine->send(array($data, $len));
                    }
                }
            }
        }
    }
}

class AsyncTask {
    public $data;
    public $len;
    public $ip;
    public $port;
    public $timeout;

    public function __construct($data, $len, $ip, $port, $timeout) {
        $this->data = $data;
        $this->len = $len;
        $this->ip = $ip;
        $this->port = $port;
        $this->timeout = $timeout;
    }
}

function RequestHandler($socket, $req_buf, $req_len, $ip, $port) {
    //echo "[RequestHandler] before yield AsyncTask. REQ=$req_buf\n";
    list($rsp_buf, $rsp_len) = (yield new AsyncTask($req_buf, $req_len, "127.0.0.1", 2345, 1000));
    //echo "[RequestHandler] after yield AsyncTask. RSP=$rsp_buf\n";
    socket_sendto($socket, $rsp_buf, $rsp_len, 0, $ip, $port);
}

$server = new AsyncServer(RequestHandler);
$server->Run();

?>

代码解读:

  • 为了便于说明问题,这里所有底层通讯基于UDP,省略了TCP的connect等繁琐细节
  • AsyncServer为底层框架类,封装了网络通讯细节以及协程切换细节,通过socket进行coroutine绑定
  • RequestHandler为业务处理函数,通过yield new AsyncTask()实现异步网络交互

第二版完善

第一版遗留问题:

  • 异步网络交互的timeout未实现,仅预留了接口参数
  • yield new AsyncTask()调用方式不够自然,略感别扭
<?php

class AsyncServer {
    protected $handler;
    protected $socket;
    protected $tasks = [];
    protected $timers = [];

    public function __construct(callable $handler) {
        $this->handler = $handler;

        $this->socket = socket_create(AF_INET, SOCK_DGRAM, SOL_UDP);
        if(!$this->socket) {
            die(socket_strerror(socket_last_error())."\n");
        }
        if (!socket_set_nonblock($this->socket)) {
            die(socket_strerror(socket_last_error())."\n");
        }
        if(!socket_bind($this->socket, "0.0.0.0", 1234)) {
            die(socket_strerror(socket_last_error())."\n");
        }
    }

    public function Run() {
        while (true) {
            $now = microtime(true) * 1000;
            foreach ($this->timers as $time => $sockets) {
                if ($time > $now) break;
                foreach ($sockets as $one) {
                    list($socket, $coroutine) = $this->tasks[$one];
                    unset($this->tasks[$one]);
                    socket_close($socket);
                    $coroutine->throw(new Exception("Timeout"));
                }
                unset($this->timers[$time]);
            }

            $reads = array($this->socket);
            foreach ($this->tasks as list($socket)) {
                $reads[] = $socket;
            }
            $writes = NULL;
            $excepts= NULL;
            if (!socket_select($reads, $writes, $excepts, 0, 1000)) {
                continue;
            }

            foreach ($reads as $one) {
                $len = socket_recvfrom($one, $data, 65535, 0, $ip, $port);
                if (!$len) {
                    //echo "socket_recvfrom fail.\n";
                    continue;
                }
                if ($one == $this->socket) {
                    //echo "[Run]request recvfrom succ. data=$data ip=$ip port=$port\n";
                    $handler = $this->handler;
                    $coroutine = $handler($one, $data, $len, $ip, $port);
                    if (!$coroutine) {
                        //echo "[Run]everything is done.\n";
                        continue;
                    }
                    $task = $coroutine->current();
                    //echo "[Run]AsyncTask recv. data=$task->data ip=$task->ip port=$task->port timeout=$task->timeout\n";
                    $socket = socket_create(AF_INET, SOCK_DGRAM, SOL_UDP);
                    if(!$socket) {
                        //echo socket_strerror(socket_last_error())."\n";
                        $coroutine->throw(new Exception(socket_strerror(socket_last_error()), socket_last_error()));
                        continue;
                    }
                    if (!socket_set_nonblock($socket)) {
                        //echo socket_strerror(socket_last_error())."\n";
                        $coroutine->throw(new Exception(socket_strerror(socket_last_error()), socket_last_error()));
                        continue;
                    }
                    socket_sendto($socket, $task->data, $task->len, 0, $task->ip, $task->port);
                    $deadline = $now + $task->timeout;
                    $this->tasks[$socket] = [$socket, $coroutine, $deadline];
                    $this->timers[$deadline][$socket] = $socket;
                } else {
                    //echo "[Run]response recvfrom succ. data=$data ip=$ip port=$port\n";
                    list($socket, $coroutine, $deadline) = $this->tasks[$one];
                    unset($this->tasks[$one]);
                    unset($this->timers[$deadline][$one]);
                    socket_close($socket);
                    $coroutine->send(array($data, $len));
                }
            }
        }
    }
}

class AsyncTask {
    public $data;
    public $len;
    public $ip;
    public $port;
    public $timeout;

    public function __construct($data, $len, $ip, $port, $timeout) {
        $this->data = $data;
        $this->len = $len;
        $this->ip = $ip;
        $this->port = $port;
        $this->timeout = $timeout;
    }
}

function AsyncSendRecv($req_buf, $req_len, $ip, $port, $timeout) {
    return new AsyncTask($req_buf, $req_len, $ip, $port, $timeout);
}

function RequestHandler($socket, $req_buf, $req_len, $ip, $port) {
    //echo "[RequestHandler] before yield AsyncTask. REQ=$req_buf\n";
    try {
        list($rsp_buf, $rsp_len) = (yield AsyncSendRecv($req_buf, $req_len, "127.0.0.1", 2345, 3000));
    } catch (Exception $ex) {
        $rsp_buf = $ex->getMessage();
        $rsp_len = strlen($rsp_buf);
        //echo "[Exception]$rsp_buf\n";
    }
    //echo "[RequestHandler] after yield AsyncTask. RSP=$rsp_buf\n";
    socket_sendto($socket, $rsp_buf, $rsp_len, 0, $ip, $port);
}

$server = new AsyncServer(RequestHandler);
$server->Run();

?>

代码解读:

  • 借助PHP内置array能力,实现简单的“超时管理”,以毫秒为精度作为时间分片
  • 封装AsyncSendRecv接口,调用形如yield AsyncSendRecv(),更加自然
  • 添加Exception作为错误处理机制,添加ret_code亦可,仅为展示之用

性能测试

测试环境

测试数据

  100Byte/REQ 1000Byte/REQ
async_svr_v1.php 16000/s 15000/s
async_svr_v2.php 11000/s 10000/s

展望未来

  • 有兴趣的PHPer可以基于该思路进行底层框架封装,对于常见阻塞操作进行封装,比如:connect、send、recv、sleep ...
  • 本人接触PHP时日尚浅,很多用法非最优,高手可有针对性优化,性能应该可以继续提高
  • 目前基于socket进行coroutine绑定,如果基于TCP通信,每次connect/close,开销过大,需要考虑实现连接池
  • python等语言也有类似的语言设施,有兴趣的读者可以自行研究
时间: 2024-10-03 20:47:02

PHP协程初体验的相关文章

Stackful 协程库 libgo(单机100万协程)

libgo 是一个使用 C++ 编写的协作式调度的stackful协程库, 同时也是一个强大的并行编程库. 设计之初是为高并发分布式Linux服务端程序开发提供底层框架支持,可以让链接进程序的同步的第三方库变为异步库,不影响逻辑的前提下提升其性能. 目前支持两个平台: Linux (GCC 4.8+) Windows (Win7.Win8.Win10 x86 and x64 使用VS2013/2015编译) 使用libgo编写并行程序,即可以像golang一样开发迅速且逻辑简洁,又有C++原生的

wxWidgets初学者导引(3)——wxWidgets应用程序初体验

wxWidgets初学者导引全目录   PDF版及附件下载 1 前言2 下载.安装wxWidgets3 wxWidgets应用程序初体验4 wxWidgets学习资料及利用方法指导5 用wxSmith进行可视化设计附:学习材料清单 3 wxWidgets应用程序初体验 本文中所有的体验,在Code::Blocks中进行. 为了在Code::Blocks中编译运行C++写的wxWidgets程序,需要再做些设置. 首先,需要在环境变量里添加一个wxWidgets根目录环境变量.设置方法类似于2.3

ucontext-人人都可以实现的简单协程库

1.干货写在前面 协程是一种用户态的轻量级线程.本篇主要研究协程的C/C++的实现. 首先我们可以看看有哪些语言已经具备协程语义: 比较重量级的有C#.erlang.golang* 轻量级有python.lua.javascript.ruby 还有函数式的scala.scheme等. c/c++不直接支持协程语义,但有不少开源的协程库,如: Protothreads:一个"蝇量级" C 语言协程库 libco:来自腾讯的开源协程库libco介绍,官网 coroutine:云风的一个C语

谈谈对协程的理解

什么是协程 协程是在线程之上由“用户”构建的并发单元,对OS来说无感知,协程的切换由用户自己管理和调度.(这里的用户是相较于内核而言的,一些通用库这里也理解为用户) C/C++怎么实现协程 作为一个C++后台开发,我知道像go, lua之类的语言在语言层面上提供了协程的api,但是我比较关心C++下要怎么实现这一点,下面的讨论都是从C/C++程序员的角度来看协程的问题的. boost和腾讯都推出了相关的库,语言层面没有提供这个东西.我近期阅读了微信开源的libco协程库,协程核心要解决几个问题:

python 高性能编程之协程

用 greenlet 协程处理异步事件 自从 PyCon 2011 协程成为热点话题以来,我一直对此有着浓厚的兴趣.为了异步,我们曾使用多线程编程.然而线程在有着 GIL 的 Python 中带来的性能瓶颈和多线程编程的高出错风险,"协程 + 多进程"的组合渐渐被认为是未来发展的方向.技术容易更新,思维转变却需要一个过渡.我之前在异步事件处理方面已经习惯了回调 + 多线程的思维方式,转换到协程还非常的不适应.这几天我非常艰难地查阅了一些资料并思考,得出了一个可能并不可靠的总结.尽管这个

POI初体验

Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能. 它的结构如下: HSSF - 提供读写Microsoft Excel格式档案的功能:HSSF 是Horrible SpreadSheet Format的缩写,也即“讨厌的电子表格格式”. 也许HSSF的名字有点滑稽,就本质而言它是一个非常严肃.正规的API.通过HSSF,你可以用纯Java代码来读取.写入.修改Excel文件. XSSF - 提供读

Android中socket初体验

最近要做一个Android的项目,用到socket和服务器之间交互,研究了一个小demo.主要遇到了以下几个问题: 1.客户端创建socket对象时一直失败NetworkOnMainThreadException,查了一下,原因是4.0之后在主线程中执行http请求会报这个错.解决办法是将代码放到了一个新线程中,问题就解决了. 2.服务器接收到客户端信息后反馈给客户端信息,将该信息表示在客户端UI上时报“android.view.ViewRoot$CalledFromWrongThreadExc

9)网络并发 编程、进程、线程和协程

并发网络 Server: #!/usr/bin/env python#-*-conding:utf-8-*-import socketsk = socket.socket()sk.bind(('127.0.0.1',9009))sk.listen()conn,addr = sk.accept()conn.send(b'heooo')msg = conn.recv(1024)print(msg)conn.close()sk.close() Client: #!/usr/bin/env python

玩转python(7)python多协程,多线程的比较

前段时间在做一个项目,项目本身没什么难度,只是数据存在一个数据接口服务商那儿,这就意味着,前端获取数据需要至少两次http请求,第一次是前端到后端的请求,第二次是后端到数据接口的请求.有时,后端接收到前端的一次请求后,可能需要对多个接口进行请求,按照传统串行执行请求的方法,用户体验肯定是非常糟糕了,而且对计算资源也是极大的浪费,正好前段时间学习了协程和线程的知识,所以我花了一些时间,对几种可行方案进行了测试对比.一开始我使用真正的网络io进行测试,发现这种方法受网络环境影响比较大,为了公平起见,