PHP内核解密系列:zend

解释器引擎最终执行op的函数是zend_execute,实际上zend_execute是一个函数指针,在引擎初始化的时候zend_execute默认指向了execute,这个execute定义在{PHPSRC}/Zend/zend_vm_execute.h:ZEND_API void execute(zend_op_array *op_array TSRMLS_DC) {zend_execute_data *execute_data;zend_bool nested = 0;zend_bool original_in_execution = EG(in_execution);if (EG(exception)) {return;}EG(in_execution) = 1;zend_vm_enter:/* Initialize execute_data */execute_data = (zend_execute_data *)zend_vm_stack_alloc(ZEND_MM_ALIGNED_SIZE(sizeof(zend_execute_data)) +ZEND_MM_ALIGNED_SIZE(sizeof(zval**) * op_array->last_var * (EG(active_symbol_table) ? 1 : 2)) +ZEND_MM_ALIGNED_SIZE(sizeof(temp_variable)) * op_array->T TSRMLS_CC);EX(CVs) = (zval***)((char*)execute_data + ZEND_MM_ALIGNED_SIZE(sizeof(zend_execute_data)));memset(EX(CVs), 0, sizeof(zval**) * op_array->last_var);EX(Ts) = (temp_variable *)(((char*)EX(CVs)) + ZEND_MM_ALIGNED_SIZE(sizeof(zval**) * op_array->last_var * (EG(active_symbol_table) ? 1 : 2)));EX(fbc) = NULL;EX(called_scope) = NULL;EX(object) = NULL;EX(old_error_reporting) = NULL;EX(op_array) = op_array;EX(symbol_table) = EG(active_symbol_table);EX(prev_execute_data) = EG(current_execute_data);EG(current_execute_data) = execute_data;EX(nested) = nested;nested = 1;if (op_array->start_op) {ZEND_VM_SET_OPCODE(op_array->start_op);} else {ZEND_VM_SET_OPCODE(op_array->opcodes);}if (op_array->this_var != -1 && EG(This)) {Z_ADDREF_P(EG(This)); /* For $this pointer */if (!EG(active_symbol_table)) {EX(CVs)[op_array->this_var] = (zval**)EX(CVs) + (op_array->last_var + op_array->this_var);*EX(CVs)[op_array->this_var] = EG(This);} else {if (zend_hash_add(EG(active_symbol_table), "this", sizeof("this"), &EG(This), sizeof(zval *), (void**)&EX(CVs)[op_array->this_var])==FAILURE) {Z_DELREF_P(EG(This));}}}EG(opline_ptr) = &EX(opline);EX(function_state).function = (zend_function *) op_array;EX(function_state).arguments = NULL;while (1) {int ret; #ifdef ZEND_WIN32if (EG(timed_out)) {zend_timeout(0);} #endifif ((ret = EX(opline)->handler(execute_data TSRMLS_CC)) > 0) {switch (ret) {case 1:EG(in_execution) = original_in_execution;return;case 2:op_array = EG(active_op_array);goto zend_vm_enter;case 3:execute_data = EG(current_execute_data);default:break;}}}zend_error_noreturn(E_ERROR, "Arrived at end of main loop which shouldn’t happen"); }此函数的参数为op_array,这是一个指向zend_op_array的指针,op_array是在编译过程中生成,这里有必要介绍一下zend_op_array这个类型。参考来源: zend_op_array简介此类型的定义在{PHPSRC}/Zend/zend_compile.h:struct _zend_op_array {/* Common elements */zend_uchar type;char *function_name;zend_class_entry *scope;zend_uint fn_flags;union _zend_function *prototype;zend_uint num_args;zend_uint required_num_args;zend_arg_info *arg_info;zend_bool pass_rest_by_reference;unsigned char return_reference;/* END of common elements */zend_bool done_pass_two;zend_uint *refcount;zend_op *opcodes;zend_uint last, size;zend_compiled_variable *vars;int last_var, size_var;zend_uint T;zend_brk_cont_element *brk_cont_array;int last_brk_cont;int current_brk_cont;zend_try_catch_element *try_catch_array;int last_try_catch;/* static variables support */HashTable *static_variables;zend_op *start_op;int backpatch_count;zend_uint this_var;char *filename;zend_uint line_start;zend_uint line_end;char *doc_comment;zend_uint doc_comment_len;zend_uint early_binding; /* the linked list of delayed declarations */void *reserved[ZEND_MAX_RESERVED_RESOURCES]; };typedef struct _zend_op_array zend_op_array;此结构比较复杂,我们目前只介绍最基本的几个字段。1.type:op_array的类型,首先需要说明的是,一段PHP代码被编译之后,虽然返回的是一个zend_op_array指针,但是实际上生成的zend_op_array结构可能不止一个,通过这个结构中的一些字段,例如function_name ,num_args等你也许会发现这个zend_op_array结构似乎能和函数产生一定的联系,确实如此,用户自定义的函数,以及用户定义的类的方法,都是一个zend_op_array结构,这些zend_op_array结构在编译过程中被保存在某些地方,例如用户自定义的函数被保存进了GLOBAL_FUNCTION_TABLE,这个是全局函数符号表,通过函数名可以在此表中检索到函数体。那么编译后返回的那个zend_op_array指针是什么呢,其实编译后返回的zend_op_array是执行的一个入口,也可以认为它是最外层,即不在任何函数体内的全局代码组成的op_array。然而全局代码,用户自定义函数,用户自定义的方法都拥有相同的type值:2 ,type可取值的宏定义为:#define ZEND_INTERNAL_FUNCTION1 #define ZEND_USER_FUNCTION2 #define ZEND_OVERLOADED_FUNCTION3 #define ZEND_EVAL_CODE4 #define ZEND_OVERLOADED_FUNCTION_TEMPORARY 5可以看到全局代码,用户函数,用户方法都对应的是ZEND_USER_FUNCTION,这个也是最常见的type了,其中ZEND_EVAL_CODE对应的是eval函数中的PHP代码,所以我们可以想到,eval函数参数中的PHP代码也会被编译成单独的zend_op_array。2.function_name如果op_array是由用户定义的函数或则方法编译而生成,那么此字段对应函数的名字,如果是全局代码或则是eval部分的代码,那么此字段为控制。3.opcodes这个字段类型为zend_op *,因此这是一个zend_op的数组,这个数组保存的就是此编译过程中生成的op,如果不了解zend_op,可以看看之前的文章 OPcode简介 , 这个字段是最重要的部分了,zend_execute最终就是执行这里保存的op。现在基本对参数op_array有了一定的了解,那么我们就开始进入到execute中。执行过程详解execute函数开始的时候是一些基础变量的申明,其中zend_execute_data *execute_data;是执行期的数据结构,此变量在进行一定的初始化之后将会被传递给每个op的handler函数作为参数,op在执行过程中随时有可能改变execute_data中的内容。第14行zend_vm_enter 这个跳转标签是作为虚拟机执行的入口,当op中涉及到函数调用的时候,就有可能会跳转到这里来执行函数体。第16行到第19行为execute_data分配空间第21行到第32行主要是对execute_data进行一些初始化,以及保存现场工作,要保存现场是因为在进入函数调用的时候,需要保存当前一些运行期间的数据,在函数调用结束之后再进行还原,可以想象为操作系统中进程调度,当进程在调出的时候需要保存寄存器等上下文环境,而当进程被调入的时候再取出来继续执行。第41行到第51行主要是在当前动态符号表中加入$this变量,,这个是在调用对象的方法时才有必要进行。第58行开始的while无限循环就是开始执行op_array中的opcodes了,在第66行中调用当前执行的op的handler:EX(opline)->handler(execute_dataTSRMLS_CC))然后如果handler的返回值小于0则循环继续,如果大于0则进入一个switch结构:当返回值为1时:execute函数将返回,执行也就结束了。当返回值为2时:op_array被重新设置,并跳转到zend_vm_enter,这个一般是函数调用或则执行eval函数中的代码,将在新的上下文执行相关函数的op_array当返回值为3时:循环体继续继续执行,当然再继续执行之前,EX(opline)已经往后移了一位(可能多位),也就是已经指向了后面一个新的opline,于是继续执行新的opline当返回其他值时:结束循环,报错,结束应该用return,也就是返回1在op的handler中返回特定的值都被定义成了宏,例如{PHPSRC}/Zend/zend_execute.c中定义的:#define ZEND_VM_NEXT_OPCODE() /CHECK_SYMBOL_TABLES() /EX(opline)++; /ZEND_VM_CONTINUE()#define ZEND_VM_SET_OPCODE(new_op) /CHECK_SYMBOL_TABLES() /EX(opline) = new_op#define ZEND_VM_JMP(new_op) /CHECK_SYMBOL_TABLES() /if (EXPECTED(!EG(exception))) { /EX(opline) = new_op; /} /ZEND_VM_CONTINUE()#define ZEND_VM_INC_OPCODE() /EX(opline)++以及在{PHPSRC}/Zend/zend_vm_execute.c中定义的:#define ZEND_VM_CONTINUE() return 0 #define ZEND_VM_RETURN()return 1 #define ZEND_VM_ENTER()return 2 #define ZEND_VM_LEAVE()return 3 #define ZEND_VM_DISPATCH(opcode, opline) return zend_vm_get_opcode_handler(opcode, opline)(ZEND_OPCODE_HANDLER_ARGS_PASSTHRU);简单介绍功能ZEND_VM_NEXT_OPCODE():移动到下一条op,返回0,不进入switch,循环继续(这个是最常用到的)ZEND_VM_SET_OPCODE(new_op):当前opline设置成new_opZEND_VM_JMP(new_op) :当前opline设置成new_op,返回0,不进入switch,循环继续ZEND_VM_INC_OPCODE():仅仅移动到下一条op执行环境的切换在前面的内容已经提到,用户自定义函数,类方法,eval的代码都会编译成单独的op_array,那么当进行函数调用等操作时,必然涉及到调用前的op_array执行环境和新的函数的op_array执行环境的切换,这一段我们将以调用用户自定义函数来介绍整个切换过程如何进行。介绍此过程前必须了解执行环境的相关数据结构,涉及到执行环境的数据结构主要有两个:1. 执行期全局变量结构相关的定义在{PHPSRC}/Zend/zend_globals_macros.h:/* Executor */ #ifdef ZTS # define EG(v) TSRMG(executor_globals_id, zend_executor_globals *, v) #else # define EG(v) (executor_globals.v) extern ZEND_API zend_executor_globals executor_globals; #endif这里是一个条件编译,ZTS表示线程安全启用,为了简化,我们这里以非线程安全模式的情况下来介绍,那么执行期的全局变量就是executor_globals,其类型为zend_executor_globals, zend_executor_globals的定义在{PHPSRC}/Zend/zend_globals.h,结构比较庞大,这里包含了整个执行期需要用到的各种变量,无论是哪个op_array在执行,都共用这一个全局变量,在执行过程中,此结构中的一些成员可能会改变,比如当前执行的op_array字段active_op_array,动态符号表字段active_symbol_table可能会根据不同的op_array而改变,This指针会根据在不同的对象环境而改变。另外还定义了一个EG宏来取此变量中的字段值,此宏是针对线程安全和非线程安全模式的一个封装。2.每个op_array自身的执行数据针对每一个op_array,都会有自己执行期的一些数据,在函数execute开始的时候我们能看到zend_vm_enter跳转标签下面就会初始一个局部变量execute_data,所以我们每次切换到新的op_array的时候,都会为新的op_array建立一个execute_data变量,此变量的类型为zend_execute_data的指针,相关定义在{PHPSRC}/Zend/zend_compile.h:struct _zend_execute_data {struct _zend_op *opline;zend_function_state function_state;zend_function *fbc; /* Function Being Called */zend_class_entry *called_scope;zend_op_array *op_array;zval *object;union _temp_variable *Ts;zval ***CVs;HashTable *symbol_table;struct _zend_execute_data *prev_execute_data;zval *old_error_reporting;zend_bool nested;zval **original_return_value;zend_class_entry *current_scope;zend_class_entry *current_called_scope;zval *current_this;zval *current_object;struct _zend_op *call_opline; };可以用EX宏来取其中的值:#define EX(element) execute_data->element这里只简单介绍其中两个字段:opline: 当前正在执行的op。prev_execute_data: op_array环境切换的时候,这个字段用来保存切换前的op_array,此字段非常重要,他能将每个op_array的execute_data按照调用的先后顺序连接成一个单链表,每当一个op_array执行结束要还原到调用前op_array的时候,就通过当前的execute_data中的prev_execute_data字段来得到调用前的执行器数据。在executor_globals中的字段current_execute_data就是指向当前正在执行的op_array的execute_data。再正式介绍之前还需要简单的介绍一下用户自定义函数的调用过程,详细的过程以后再函数章节中专门介绍,这里简单的说明一下:在调用函数的时候,比如test()函数,会先在全局函数符号表中根据test来搜索相关的函数体,如果搜索不到则会报错函数没有定义,找到test的函数体之后,取得test函数的op_array,然后跳转到execute中的goto标签:zend_vm_enter,于是就进入到了test函数的执行环境。下面我们将以一段简单的代码来介绍执行环境切换过程,例子代码:<?php $a = 123;test();function test() {return 1; } ?>这段代码非常简单,这样方便我们介绍原理,复杂的代码读者可以举一反三。此代码编译之后会生成两个op_array,一个是全局代码的op_array,另外一个是test函数的op_array,其中全局代码中会通过函数调用进入到test函数的执行环境,执行结束之后,会返回到全局代码,然后代码结束。下面我们分几个阶段来介绍这段代码的过程,然后从中可以知道执行环境切换的方法。1. 进入execute函数,开始执行op_array ,这个op_array就是全局代码的op_array,我们暂时称其为op_array1首先在execute中为op_array1建立了一个execute_data数据,我们暂时命名为execute_data1,然后进行相关的初始化操作,其中比较重要的是:EX(op_array) = op_array; // 设置op_array字段为当前执行的op_array,也就是全局代码的op_array1EX(prev_execute_data) = EG(current_execute_data);//将全局执行数据中保存的当前op_array执行数据保存到op_array1的execute_data1的prev_execute_data字段,由于这是执行的第一个op_array,所以prev_execute_data实际上是空值,然后将执行期全局变量的current_execute_data设置成execute_data1,然后设置execute_data1的当前执行op,这样就可以开始执行当前的op了2. 在op_array1执行到test函数调用的的时候,首先从全局函数符号表中找到test的函数体,将函数体保存在execute_data1的function_state字段,然后从函数体中取到test的op_array,我们这里用op_array2来表示,并将op_array2赋值给EG(active_op_array):EG(active_op_array) = &EX(function_state).function->op_array;于是执行期全局变量的动态op_array字段指向了函数test的op_array,然后用调用ZEND_VM_ENTER();这个时候会先回到execute函数中的switch结构,并且满足以下casecase 2:op_array = EG(active_op_array);goto zend_vm_enter;EG(active_op_array)之前已经被我们设置为test函数的op_array2,于是在函数execute中,op_array变量就指向了test的op_array2,然后跳转到zend_vm_enter。3. 跳转到zend_vm_enter之后其实又回到了类似1中的步骤,此时为test的op_array2建立了它的执行数据execute_data,我们这里用execute_data2来表示。跟1中有些不同的是EX(prev_execute_data) = EG(current_execute_data);这个时候current_execute_data = execute_data1,也就是全局代码的执行执行期数据,然后EG(current_execute_data) = execute_data;这样current_execute_data就等于test的执行期数据execute_data2了,同时全局代码的execute_data1被保存在execute_data2的prev_execute_data字段。这个时候进行环境的切换已经完成,于是开始执行test函数。4. test函数执行完之后就要返回到调用前的执行环境了,也就是全局代码执行环境,此阶段最重要的一个操作就是EG(current_execute_data) = EX(prev_execute_data); 在3中EX(prev_execute_data)已经设置成了全局代码的execute_data1,所以这样当前执行数据就变成了全局代码的执行数据,这样就成功的从函数test执行环境返回到了全局代码执行环境这样,执行环境的切换过程就完成了,对于深层次的函数调用,原理一样,执行数据execute_data组成的单链表会更长。延伸阅读此文章所在专题列表如下:PHP内核探索:从SAPI接口开始PHP内核探索:一次请求的开始与结束PHP内核探索:一次请求生命周期PHP内核探索:单进程SAPI生命周期PHP内核探索:多进程/线程的SAPI生命周期PHP内核探索:Zend引擎PHP内核探索:再次探讨SAPIPHP内核探索:Apache模块介绍PHP内核探索:通过mod_php5支持PHPPHP内核探索:Apache运行与钩子函数PHP内核探索:嵌入式PHPPHP内核探索:PHP的FastCGIPHP内核探索:如何执行PHP脚本PHP内核探索:PHP脚本的执行细节PHP内核探索:操作码OpCodePHP内核探索:PHP里的opcodePHP内核探索:解释器的执行过程PHP内核探索:变量概述PHP内核探索:变量存储与类型PHP内核探索:PHP中的哈希表PHP内核探索:理解Zend里的哈希表PHP内核探索:PHP哈希算法设计PHP内核探索:翻译一篇HashTables文章PHP内核探索:哈希碰撞攻击是什么?PHP内核探索:常量的实现PHP内核探索:变量的存储PHP内核探索:变量的类型PHP内核探索:变量的值操作PHP内核探索:变量的创建PHP内核探索:预定义变量PHP内核探索:变量的检索PHP内核探索:变量的类型转换PHP内核探索:弱类型变量的实现PHP内核探索:静态变量的实现PHP内核探索:变量类型提示PHP内核探索:变量的生命周期PHP内核探索:变量赋值与销毁PHP内核探索:变量作用域PHP内核探索:诡异的变量名PHP内核探索:变量的value和type存储PHP内核探索:全局变量GlobalPHP内核探索:变量类型的转换PHP内核探索:内存管理开篇PHP内核探索:Zend内存管理器PHP内核探索:PHP的内存管理PHP内核探索:内存的申请与销毁PHP内核探索:引用计数与写时复制PHP内核探索:PHP5.3的垃圾回收机制PHP内核探索:内存管理中的cachePHP内核探索:写时复制COW机制PHP内核探索:数组与链表PHP内核探索:使用哈希表APIPHP内核探索:数组操作PHP内核探索:数组源码分析PHP内核探索:函数的分类PHP内核探索:函数的内部结构PHP内核探索:函数结构转换PHP内核探索:定义函数的过程PHP内核探索:函数的参数PHP内核探索:zend_parse_parameters函数PHP内核探索:函数返回值PHP内核探索:形参return valuePHP内核探索:函数调用与执行PHP内核探索:引用与函数执行PHP内核探索:匿名函数及闭包PHP内核探索:面向对象开篇PHP内核探索:类的结构和实现PHP内核探索:类的成员变量PHP内核探索:类的成员方法PHP内核探索:类的原型zend_class_entryPHP内核探索:类的定义PHP内核探索:访问控制PHP内核探索:继承,多态与抽象类PHP内核探索:魔术函数与延迟绑定PHP内核探索:保留类与特殊类PHP内核探索:对象PHP内核探索:创建对象实例PHP内核探索:对象属性读写PHP内核探索:命名空间PHP内核探索:定义接口PHP内核探索:继承与实现接口PHP内核探索:资源resource类型PHP内核探索:Zend虚拟机PHP内核探索:虚拟机的词法解析PHP内核探索:虚拟机的语法分析PHP内核探索:中间代码opcode的执行PHP内核探索:代码的加密与解密PHP内核探索:zend_execute的具体执行过程PHP内核探索:变量的引用与计数规则PHP内核探索:新垃圾回收机制说明

像一颗深绿色的宝石镶嵌在云南大地上,

PHP内核解密系列:zend

相关文章:

你感兴趣的文章:

标签云: