php内核解析

php是先把源码解析成opcode，然后再把opcode传递给zend_vm进行执行的。

// 一个opcode的结构
struct _zend_op {
     const void *handler; // opcode对应的执行函数，每个opcode都有一个对应的执行函数
     znode_op op1;  // 执行参数的第一个元素
     znode_op op2;  //  执行参数的第二个元素
     znode_op result; // 执行结果
     uint32_t extended_value; // 额外扩展的字段和值
     uint32_t lineno; // 行数
     zend_uchar opcode;   // 操作码，具体操作码列表见 http://cn.php.net/manual/zh/internals2.opcodes.php
     zend_uchar op1_type; // 第一个元素的类型
     zend_uchar op2_type; // 第二个元素的类型
     zend_uchar result_type; // 结果的类型
};

在php7中，我们能很方便用phpdbg来查看一个文件或者一个函数的opcode了。至于phpdbg的使用，现在网上介绍不多，不过好在有很详细的help文档。下面是一个最简单的opcode代码：

$ bin/phpdbg -f /home/xiaoju/software/php7/demo/echo.php
prompt> list 100
00001: <?php
00002:
00003: $a = 1;
00004: $b = $a;
00005: $b = $b + 1;
00006: echo $b;
00007:
prompt> print exec
[Context /home/xiaoju/software/php7/demo/echo.php (6 ops)]
L1-7 {main}() /home/xiaoju/software/php7/demo/echo.php - 0x7fe3fae63300 + 6 ops
L3    #0     ASSIGN                  $a                   1
L4    #1     ASSIGN                  $b                   $a
L5    #2     ADD                     $b                   1                    ~2
L5    #3     ASSIGN                  $b                   ~2
L6    #4     ECHO                    $b
L7    #5     RETURN                  1

这个php文件就做了一个最简单的加法操作。生成了6个_zend_op。所展示的每一行代表一个_zend_op

_zendop.lineno  op号   _zend_op.opcode       _zend_op.op1          _zend_op.op2          _zend_op.result
L5              #2     ADD                     $b                   1                    ~2

这里_zend_op.opcode对应的操作在官网有文档和详细的例子可以查看：http://cn.php.net/manual/zh/internals2.opcodes.php

值得一说的是，phpdbg还有一个远端UI版本，能让我们在近端诊断服务端的php信息

gdb

但是我们的目标还是在于研究php源码，phpdbg只能分析到opcode这层，还是不够的，gdb可能是更好的选择。

gdb的使用和平时使用差不多

比如我现在有个脚本echo.php:

  1 <?php
  2
  3 $a = 1;
  4 $b = $a;
  5 $b = $b + 1;
  6 echo $b;

我的php安装路径在：

/home/xiaoju/software/php7/bin/php

php源码路径在：

/home/xiaoju/webroot/php-src/php-src-master/

运行gdb

$ gdb /home/xiaoju/software/php7/bin/php

加载gdbinit:

(gdb) source /home/xiaoju/webroot/php-src/php-src-master/.gdbinit

设置断点:

(gdb) b zend_execute_scripts

运行：

(gdb) run -f /home/xiaoju/software/php7/demo/echo.php

我想在1459这行设置个断点：

1452          for (i = 0; i < file_count; i++) {
1453               file_handle = va_arg(files, zend_file_handle *);
1454               if (!file_handle) {
1455                    continue;
1456               }
1457
1458               op_array = zend_compile_file(file_handle, type);
1459               if (file_handle->opened_path) {
1460                    zend_hash_add_empty_element(&EG(included_files), file_handle->opened_path);
1461               }

(gdb) b 1459

继续跑

(gdb) continue
(gdb) s
(gdb) s

打印出这个时候的op_array

(gdb) p *op_array
$4 = {type = 2 ‘\002‘, arg_flags = "\000\000", fn_flags = 134217728, function_name = 0x0, scope = 0x0,
  prototype = 0x0, num_args = 0, required_num_args = 0, arg_info = 0x0, refcount = 0x7ffff6002000, last = 6,
  opcodes = 0x7ffff6076240, last_var = 2, T = 4, vars = 0x7ffff6079030, last_live_range = 0, last_try_catch = 0,
  live_range = 0x0, try_catch_array = 0x0, static_variables = 0x0, filename = 0x7ffff605c2d0, line_start = 1,
  line_end = 7, doc_comment = 0x0, early_binding = 4294967295, last_literal = 3, literals = 0x7ffff60030c0,
  cache_size = 0, run_time_cache = 0x0, reserved = {0x0, 0x0, 0x0, 0x0}}

我可以优化输出：

(gdb) set print pretty on
(gdb) p *op_array
$5 = {
  type = 2 ‘\002‘,
  arg_flags = "\000\000",
  fn_flags = 134217728,
  function_name = 0x0,
  scope = 0x0,
  prototype = 0x0,
  num_args = 0,
  required_num_args = 0,
  arg_info = 0x0,
  refcount = 0x7ffff6002000,
  last = 6,
  opcodes = 0x7ffff6076240,
  last_var = 2,
  T = 4,
  vars = 0x7ffff6079030,
  last_live_range = 0,
  last_try_catch = 0,
  live_range = 0x0,
  try_catch_array = 0x0,
  static_variables = 0x0,
  filename = 0x7ffff605c2d0,
  line_start = 1,
  line_end = 7,
  doc_comment = 0x0,
  early_binding = 4294967295,
  last_literal = 3,
  literals = 0x7ffff60030c0,
  cache_size = 0,
  run_time_cache = 0x0,
  reserved = {0x0, 0x0, 0x0, 0x0}
}

我想打出op_array.filename.val的具体值

(gdb) p (op_array.filename.len)
$12 = 40
(gdb) p *(op_array.filename.val)@40
$13 = "/home/xiaoju/software/php7/demo/echo.php"

好了，我们可以顺便研究下_zend_op_array这个结构：

// opcode组成的数组，编译的时候就是生成这个结构
struct _zend_op_array {
     zend_uchar type;  // op array的类型，比如 ZEND_EVAL_CODE
     zend_uchar arg_flags[3]; /* bitset of arg_info.pass_by_reference */
     uint32_t fn_flags;
     zend_string *function_name;
     zend_class_entry *scope;
     zend_function *prototype;
     uint32_t num_args;  // 脚本的参数
     uint32_t required_num_args;
     zend_arg_info *arg_info;
     /* END of common elements */

     uint32_t *refcount; // 这个结构的引用次数

     uint32_t last;  // opcode的个数
     zend_op *opcodes;  // 存储所有的opcode

     int last_var; // php变量的个数
     uint32_t T;
     zend_string **vars; // 被编译的php变量的个数

     int last_live_range;
     int last_try_catch;  // try_catch的个数
     zend_live_range *live_range;
     zend_try_catch_element *try_catch_array; //

     /* static variables support */
     HashTable *static_variables; // 静态变量

     zend_string *filename;  // 执行的脚本的文件
     uint32_t line_start; // 开始于第几行
     uint32_t line_end; // 结束于第几行
     zend_string *doc_comment; // 文档的注释
     uint32_t early_binding; /* the linked list of delayed declarations */

     int last_literal;
     zval *literals;

     int  cache_size;
     void **run_time_cache;

     void *reserved[ZEND_MAX_RESERVED_RESOURCES]; // 保留字段
};转自http://www.cnblogs.com/yjf512/

时间： 2025-01-13 01:04:23

php内核解析的相关文章

c#网络通信框架networkcomms内核解析序言

networkcomms是我遇到的写的最优美的代码,很喜欢,推荐给大家:) 基于networkcomms2.3.1开源版本( gplv3)协议,写了一些文章,希望大家喜欢,个人水平有限,不足之处难免. networkcommsc#通信框架来自于美丽的英国剑桥,由大洋彼岸的两位工程师 Marc Fletcher, Matthew Dean开发. c#网络通信框架networkcomms内核解析之一消息传送 c#网络通信框架networkcomms内核解析之二消息处理流程 c#网络通信框架net

c#网络通信框架networkcomms内核解析之十支持优先级的自定义线程池

本例基于networkcomms2.3.1开源版本 gplv3协议如果networkcomms是一顶皇冠,那么CommsThreadPool(自定义线程池)就是皇冠上的明珠了,这样说应该不夸张的,她那么优美,简洁,高效. 在 <c#网络通信框架networkcomms内核解析之六处理接收到的二进制数据>中我们曾经提到,服务器收到数据后,如果是系统内部保留类型数据或者是最高优先级数据,系统会在主线程中处理,其他的会交给自定义线程池进行处理. 作为服务器,处理成千上万的连接及数据,单线程性能

c#网络通信框架networkcomms内核解析之八数据包的核心处理器

我们先回顾一个 c#网络通信框架networkcomms内核解析之六处理接收到的二进制数据中,主程序把PacketBuilder 中的数据交给核心处理器处理的过程 //创建优先级队列项目 PriorityQueueItem item = new PriorityQueueItem(priority, this, topPacketHeader, packetBuilder.ReadDataSection(packetHeaderSize, topPacketHeader.PayloadPac

c#网络通信框架networkcomms内核解析

Spark(1.0) 内核解析

Spark的内核部分主要从以下几个方面介绍: 任务调度系统.I/0模块.通信控制模块.容错模块.shuffle模块一.任务调度系统 1.作业执行流程接下来注意几个概念: Application:用户自定义的Spark程序,用户提交后,Spark为App分配资源,将程序转换并执行. Driver Program:运行Application的main()函数并创建SparkContext RDD Graph:RDD是Spark的核心结构,可以通过一系列算子进行操作(主要有Transformati

Linux内核解析:进程间通信：管道

管道的定义管道的用途管道的操作管道非法read与write内核实现解析管道通信原理及其亲戚通信解析父子进程通信解析亲缘关系的进程管道通信解析管道的注意事项及其性质管道有以下三条性质shell管道的实现与shell命令进行通信system函数与popen函数区别管道的定义管道是第一个广泛应用的进程间通信手段.日常在终端执行shell命令时,会大量用到管道.但管道的缺陷在于只能在有亲缘关系(有共同的祖先)的进程之间使用.为了突破这个限制,后来引入了命名管道. 管道的用途管道是最早出现的进程间通

WebCollector内核解析—如何设计一个爬虫

本文利用WebCollector内核的解析,来描述如何设计一个网络爬虫.我们先来看看两个非常优秀爬虫的设计. Nutch Nutch由apache开源组织提供,主页:http://nutch.apache.org/ Nutch是目前最好的网络爬虫之一,Nutch分为内核和插件两个模块组成,内核控制整个爬取的逻辑,插件负责完成每个细节(与流程无关的细节)的实现.具体分工如下: 内核:控制爬虫按照 Inject -> Generator -> Fetch -> Parse -> Upd

【Spark 内核】 Spark 内核解析-下

Spark内核泛指Spark的核心运行机制,包括Spark核心组件的运行机制.Spark任务调度机制.Spark内存管理机制.Spark核心功能的运行原理等,熟练掌握Spark内核原理,能够帮助我们更好地完成Spark代码设计,并能够帮助我们准确锁定项目运行过程中出现的问题的症结所在. Spark Shuffle 解析 Shuffle 的核心要点 ShuffleMapStage与ResultStage 在划分stage时,最后一个stage称为finalStage,它本质上是一个ResultSt

c#网络通信框架networkcomms内核解析之六处理接收到的二进制数据

在networkcomms通信系统中,服务器端收到某连接上的数据后,数据会暂时存放在"数据包创建器"(PacketBuilder)中,PacketBuilder类似一个流动的容器,收到的数据被服务器处理完成后,相应在二进制数据,会从存储他的PacketBuilder中删除. 我们知道在networkcomms的消息体系中,传送的数据的第一个字节用来存储数据包包头长度,解析出数据包包头后,包头中包含数据包长度.所以在读入进入PacketBuilder中的数据,会根据第一个字节中存储的数据

c#网络通信框架networkcomms内核解析之七数据包创建器（PacketBuilder)

PacketBuilder 数据包创建器,用于辅助创建数据包. 程序把Tcp连接上收到的二进制数据暂时存储在 packetBuilder中,如果收到的数据足够多,程序会把数据包包头解析出来,并根据数据包包头中的数据,解析出数据包大小,根据数据包大小,从PacketBuilder中截取相应的二进制数据,把这部分数据以内存流(MemoryStream)的形式,加上数据包包头一起交给NetworkComms.CompleteIncomingItemTask()方法进行处理. PacketBuilder