PHP与Golang如何通信?

最近遇到的一个场景:php项目中需要使用一个第三方的功能(结巴分词),而github上面恰好有一个用Golang写好的类库。那么问题就来了,要如何实现不同语言之间的通信呢?

常规的方案:

  • 用Golang写一个http/TCP服务,php通过http/TCP与Golang通信
  • 将Golang经过较多封装,做为php扩展。
  • PHP通过系统命令,调取Golang的可执行文件

存在的问题:

  • http请求,网络I/O将会消耗大量时间
  • 需要封装大量代码
  • PHP每调取一次Golang程序,就需要一次初始化,时间消耗很多

优化目标:

  • Golang程序只初始化一次(因为初始化很耗时)
  • 所有请求不需要走网络
  • 尽量不大量修改代码

解决方案:

  • 简单的Golang封装,将第三方类库编译生成为一个可执行文件
  • PHP与Golang通过双向管道通信

使用双向管道通信优势:

1:只需要对原有Golang类库进行很少的封装
2:性能最佳 (IPC通信是进程间通信的最佳途径)
3:不需要走网络请求,节约大量时间
4:程序只需初始化一次,并一直保持在内存中

具体实现步骤:

  • 1:类库中的原始调取demo

          package main
          import (
              "fmt"
              "github.com/yanyiwu/gojieba"
              "strings"
          )
    
          func main() {
              x := gojieba.NewJieba()
              defer x.Free()
    
              s := "小明硕士毕业于中国科学院计算所,后在日本京都大学深造"
              words := x.CutForSearch(s, true)
              fmt.Println(strings.Join(words, "/"))
          }    

    保存文件为main.go,就可以运行

  • 2:调整后代码为:
        package main
          import (
              "bufio"
              "fmt"
              "github.com/yanyiwu/gojieba"
              "io"
              "os"
              "strings"
          )
    
          func main() {
    
              x := gojieba.NewJieba(
                  "/data/tmp/jiebaDict/jieba.dict.utf8",
                  "/data/tmp/jiebaDict/hmm_model.utf8",
                  "/data/tmp/jiebaDict/user.dict.utf8"
              )
              defer x.Free()
    
              inputReader := bufio.NewReader(os.Stdin)
              for {
                  s, err := inputReader.ReadString(‘\n‘)
                  if err != nil && err == io.EOF {
                      break
                  }
                  s = strings.TrimSpace(s)
    
                  if s != "" {
                      words := x.CutForSearch(s, true)
                      fmt.Println(strings.Join(words, " "))
                  } else {
                      fmt.Println("get empty \n")
                  }
              }
          }

    只需要简单的几行调整,即可实现:从标准输入接收字符串,经过分词再输出
    测试:

      # go build test
      # ./test
      # //等待用户输入,输入”这是一个测试“
      # 这是 一个 测试 //程序
  • 3:使用cat与Golang通信做简单测试
      //准备一个title.txt,每行是一句文本
     # cat title.txt | ./test

    正常输出,表示cat已经可以和Golang正常交互了

  • 4:PHP与Golang通信
      以上所示的cat与Golang通信,使用的是单向管道。即:只能从cat向Golang传入数据,Golang输出的数据并没有传回给cat,而是直接输出到屏幕。但文中的需求是:php与Golang通信。即php要传数据给Golang,同时Golang也必须把执行结果返回给php。因此,需要引入双向管道。
      在PHP中管道的使用:popen("/path/test"),具体就不展开说了,因为此方法解决不了文中的问题。
    双向管道:
         $descriptorspec = array(
              0 => array("pipe", "r"),
                1 => array("pipe", "w")
          );
          $handle = proc_open(
              ‘/webroot/go/src/test/test‘,
              $descriptorspec,
              $pipes
          );
          fwrite($pipes[‘0‘], "这是一个测试文本\n");
          echo fgets($pipes[1]);

    解释:使用proc_open打开一个进程,调用Golang程序。同时返回一个双向管道pipes数组,php向$pipe[‘0‘]中写数据,从$pipe[‘1‘]中读数据。

好吧,也许你已经发现,我是标题档,这里重点要讲的并不只是PHP与Golang如何通信。而是在介绍一种方法: 通过双向管道让任意语言通信。(所有语言都会实现管道相关内容)

测试:

通过对比测试,计算出各个流程占用的时间。下面提到的title.txt文件,包含100万行文本,每行文本是从b2b平台取的商品标题

1: 整体流程耗时

# time cat title.txt | ./test > /dev/null

耗时:14.819秒,消耗时间包含:

  • 进程cat读出文本
  • 通过管道将数据传入Golang
  • Golang处理数据,将结果返回到屏幕

2:计算分词函数耗时。方案:去除分词函数的调取,即:注释掉Golang源代码中的调取分词那行的代码

time cat title.txt | ./test > /dev/null

耗时:1.817秒时间,消耗时间包含:

  • 进程cat读出文本
  • 通过管道将数据传入Golang
  • Golang处理数据,将结果返回到屏幕

分词耗时 = (第一步耗时) - (以上命令所耗时)
分词耗时 : 14.819 - 1.817 = 13.002秒

3:测试cat进程与Golang进程之间通信所占时间

time cat title.txt > /dev/null

耗时:0.015秒,消耗时间包含:

  • 进程cat读出文本
  • 通过管道将数据传入Golang
  • go处理数据,将结果返回到屏幕

管道通信耗时:(第二步耗时) - (第三步耗时)
管道通信耗时: 1.817 - 0.015 = 1.802秒

4:PHP与Golang通信的时间消耗
编写简单的php文件:

      <?php
            $descriptorspec = array(
                0 => array("pipe", "r"),
                1 => array("pipe", "w")
            );

            $handle = proc_open(
                ‘/webroot/go/src/test/test‘,
                $descriptorspec,
                $pipes
            );

            $fp = fopen("title.txt", "rb");

            while (!feof($fp)) {
                fwrite($pipes[‘0‘], trim(fgets($fp))."\n");
                echo fgets($pipes[1]);
            }

            fclose($pipes[‘0‘]);
            fclose($pipes[‘1‘]);
            proc_close($handle);

流程与上面基本一致,读出title.txt内容,通过双向管道传入Golang进程分词后,再返回给php (比上面的测试多一步:数据再通过管道返回)

time php popen.php > /dev/null

耗时:24.037秒,消耗时间包含:

  • 进程PHP读出文本
  • 通过管道将数据传入Golang
  • Golang处理数据
  • Golang将返回结果再写入管道,PHP通过管道接收数据
  • 将结果返回到屏幕

结论:

1 :整个分词过程中的耗时分布

使用cat控制逻辑耗时:        14.819 秒
使用PHP控制逻辑耗时:         24.037 秒(比cat多一次管道通信)
单向管道通信耗时:           1.8    秒
Golang中的分词函数耗时:     13.002 秒

2:分词函数的性能: 单进程,100万商品标题分词,耗时13秒 
以上时间只包括分词时间,不包括词典载入时间。但在本方案中,词典只载入一次,所以载入词典时间可以忽略(1秒左右)

3:PHP比cat慢 (这结论有点多余了,呵呵)
语言层面慢: (24.037 - 1.8 - 14.819) / 14.819 = 50%
单进程对比测试的话,应该不会有哪个语言比cat更快。

相关问题:

  • 1:以上Golang源码中写的是一个循环,也就是会一直从管道中读数据。那么存在一个问题:是不是php进程结束后,Golang的进程还会一直存在?

    管道机制自身可解决此问题。管道提供两个接口:读、写。当写进程结束或者意外挂掉时,读进程也会报错,以上Golang源代码中的err逻辑就会执行,Golang进程结束。
    但如果PHP进程没有结束,只是暂时没有数据传入,此时Golang进程会一直等待。直到php结束后,Golang进程才会自动结束。

  • 2:能否多个php进程并行读写同一个管道,Golang进程同时为其服务?

    不可以。管道是单向的,如果多个进程同时向管道中写,那Golang的返回值就会错乱。
    可以多开几个Golang进程实现,每个php进程对应一个Golang进程。

最后,上面都是瞎扯的。如果你了解管道、双向管道,上面的解释对你基本没啥用。但如果你不了解管道,调试上面的代码没问题,但稍有修改就有可能掉坑里。哈哈,推荐一本书吧,《UNIX网络编程》卷一、二,都看一下,也许要看两个月,但很有必要!

多读书、多看报,少看网页,多睡觉!

时间: 2024-10-01 06:53:19

PHP与Golang如何通信?的相关文章

今晚八点 golang 分享《如何在60分钟掌握 go 协程&amp;管道 &amp; socket 通信》

今晚八点 golang 分享<如何在60分钟掌握 go 协程&管道 & socket 通信> 内容如下: 功能演示 知识点学习 Golang 介绍 go 并发编程与通信 TCP/IP 协议族 socket 实战 使用 go net 模块开发 tcp 服务器与客户端 代码讲解 分享时间:2019.5.28——20:00-21:30 主讲人:kk 多语言混搭开发工程师,多年 PHP.Python 项目开发经验,带领团队完成多个中.小型项目开发.擅长于 Web 安全开发.性能优化.分

golang协程——通道channel阻塞

新的一年开始了,不管今天以前发生了什么,向前看,就够了. 说到channel,就一定要说一说线程了.任何实际项目,无论大小,并发是必然存在的.并发的存在,就涉及到线程通信.在当下的开发语言中,线程通讯主要有两种,共享内存与消息传递.共享内存一定都很熟悉,通过共同操作同一对象,实现线程间通讯.消息传递即通过类似聊天的方式.golang对并发的处理采用了协程的技术.golang的goroutine就是协程的实现.协程的概念很早就有,简单的理解为轻量级线程,goroutine就是为了解决并发任务间的通

利用golang实现聊天通信

实现逻辑 1.Golang 版本  1.3 2.实现原理: 1.主进程建立TCP监听服务,并且初始化一个变量 talkChan := make(map[int]chan string) 2.当主进程ACCEPT连接请求后,利用go 启动一个协程A去维持和客户端的连接,把taokChan带入到协程里 3.和客户端建立连接的协程A,发送消息给客户端,使其发送自己的用户信息. 4.协程A在收到客户端发送的用户信息后,建立一个此用户对应的管道 talkChan[uid] = make(chan stri

golang做服务器,C#(unity)作为客户端,Socket通信问题

服务器 datalen+Message----->PackageData------>网络传输([]byte)----->客户端---->UnPackageData---->datalen+Message 用Soket写网络程序,需要自己定制协议. {len+data}    len 解析出来的是data数据的长度,data 解析出来的是想要传输的数据 服务器上的Message 客户端的Message 需要注意的是客户端Message的字段命名需要和服务端的json标签保持一

在Golang中实现有无限容量的同步Queue

chan对象是Golang的一个核心卖点,可以轻松实现goroutine之间的通信.Golang允许我们为chan设置不同的缓冲大小.当默认缓冲大小为0的时候,一个goroutine对chan的写入操作必须要等到有其他goroutine对chan进行读取的时候才会返回,反之一个goroutine对chan进行读取的时候要等到另外一个goroutine对chan进行写入才会返回.如果我们不希望每次对chan进行读取和写入都堵塞的话,可以对chan设置缓冲大小.这样,在缓冲区没满之前,gorouti

golang环境中grpc与zipkin的集成

对于分布式系统服务,一个请求需要系统中多个模块,上百台机器配合才能完成.当进行系统调优时单靠分析日志是很难发现到系能瓶颈的,效率非常低下,为此google上线了分布式服务追踪系统Drapper.目前市面上的实现有Twitter的zipkin和阿里的鹰眼系统.最近我在做服务追踪,我们后台使用golang开发,grpc做服务通信,最终选择集成zipkin来做,这个公开资料比较少,写文章来总结一下,方便后来者. 一.首先zipkin的安装使用 1.下载 wget -O zipkin.jar 'http

golang

go语言特性: ◆ 自动垃圾回收 具备系统自动释放资源 ◆更丰富的内置类型 map类型.slice类型(类似vector) ◆函数多返回值 跟lua/erlang一样,支持函数多返回值,优化输入输出参数.结构体参数等传递 ◆错误处理 defer/recover/panic, defer用于资源的释放,go语言不提供构造和析构, recover截取错误处理流程,一般在使用defer的关键字函数中使用:若在无异常的goroutine中使用recover,会导致此goroutine所在的进程打印错误信

Golang、Php、Python、Java基于Thrift0.9.1实现跨语言调用

目录: 一.什么是Thrift? 1) Thrift内部框架一瞥 2) 支持的数据传输格式.数据传输方式和服务模型 3) Thrift IDL 二.Thrift的官方网站在哪里? 三.在哪里下载?需要哪些组件的支持? 四.如何安装? 五.Golang.Java.Python.PHP之间通过Thrift实现跨语言调用 1) Golang 客户端和服务端的实现及交互 2) python 客户端的实现与golang 服务端的交互 3) php 客户端的实现与golang 服务端的交互 4) java

Java程序员的Golang入门指南(下)

Java程序员的Golang入门指南(下) 4.高级特性 上面介绍的只是Golang的基本语法和特性,尽管像控制语句的条件不用圆括号.函数多返回值.switch-case默认break.函数闭包.集合切片等特性相比Java的确提高了开发效率,但这些在其他语言中也都有,并不是Golang能真正吸引人的地方.不仅是Golang,我们学习任何语言当然都是从基本语法特性着手,但学习时要不断地问自己:使这门语言区别于其他语言的"独到之处"在哪?这种独到之处往往反映了语言的设计思想.出发点.要解决