皆知PHP的数组是由HashTable和双链表实现的,为了方便大家查看数组的数据结构,开发一个遍历PHP的数组生成Dot描述的PHP插件,生成dot描述以后可以通过一些渲染工具生成图像,本例用的是 Graphviz。
扩展的实现很简单,PHP数组源码是由下面的两种结构体实现的,扩展就是将这两种结构体和各个结构体的关系遍历一遍,生成对应的Dot描述即可。
Java代码
- typedef struct bucket {
- ulong h;
- uint nKeyLength;
- void * pData;
- void * pDataPtr;
- struct bucket * pListNext;
- struct bucket * pListLast;
- struct bucket *pNext ;
- struct bucket * pLast;
- const char *arKey ;
- } Bucket;
- typedef struct _hashtable {
- uint nTableSize;
- uint nTableMask;
- uint nNumOfElements;
- ulong nNextFreeElement;
- Bucket *pInternalPointer;
- Bucket *pListHead;
- Bucket *pListTail;
- Bucket **arBuckets;
- dtor_func_t pDestructor;
- zend_bool persistent;
- unsigned char nApplyCount ;
- zend_bool bApplyProtection;
- } HashTable;
扩展里边函数说明
---------------------------------------------------------------------------------------------
string dotarray( array $input [, int $flag] )
生成数组数据结构的dot描述
参数
input 需要操作的数组
flag 查看那些数据结构,是扩展提供的3个常量或操作,分别是
DOTARAAY_HASH_TABLE 表示显示HashTable结构
DOTARRAY_DOUBLE_LIST 显示数组的双链表结构
DOTARRAY_CURRENT_POSITION 显示数组现在的内部指针的位置
返回值
成功返回dot描述字符串,错误(非数组等情况)返回false
---------------------------------------------------------------------------------------------
显示双链表结构例子
Java代码
- <?php
- $items = array(1,2,8=>‘lalala‘,16=>‘hahaha‘,‘name‘=>‘shiki‘,30=>‘wooooo...‘);
- next($items);/*将内部指针移到下一位*/
- $result = dotarray($items,DOTARRAY_DOUBLE_LIST|DOTARRAY_CURRENT_POSITION);
- echo $result;
得到的dot描述:
Java代码
- digraph html {label = "Structure of array";
- node[shape = record];
- ===========部分内容省略============
- edge [color=black];
- edge [color=green];
- sk_array:f5:s -> sk_item_1:f0;
- edge [color=black];
- }
通过graphviz渲染得到下面的图片
需要解释一下,红色实线为结构中双链表的next指针,红色点线为上一个元素指针。同时提供了DOTARRAY_CURRENT_POSITION标志,出现绿线指向数组内部指针指向key为1的元素(第一个元素key为0)
显示HashTable结构例子
Java代码
- <?php
- $items = array(1,2,8=>‘lalala‘,16=>‘hahaha‘,‘name‘=>‘shiki‘,30=>‘wooooo...‘);
- next($items);
- next($items);
- $result = dotarray($items,DOTARAAY_HASH_TABLE|DOTARRAY_CURRENT_POSITION);
- echo $result;
生成的结构图片如下:
hash冲突的例子
具体可以参考 PHP hash碰撞拒绝服务漏洞原理http://www.laruence.com/2011/12/29/2412.html,简单介绍即是:Hash表因为”冲突”(碰撞)而退化成链表,如果数据量足够大,
使得php在计算, 查找, 插入的时候, 造成大量的CPU占用, 从而实现拒绝服务攻击。下面是简单的碰撞生成代码:
<
Java代码
- ?php
- /*会生出pow(2,$n)个数字*/
- $n= 3;
- $capacity = pow(2,$n);
- $array =array();
- for($i=0;$i<$capacity;$i++){
- $key = $i<<$n;
- $array[$key] =1;
- }
- $str = dotarray($array,DOTARRAY_DOUBLE_LIST|DOTARAAY_HASH_TABLE);
- echo $str,PHP_EOL;
这次将hashtable和双线表同时展示出来,传递的flag为DOTARRAY_DOUBLE_LIST|DOTARAAY_HASH_TABLE,同时展示双链表和HashTable
关于 dot语言 传送门:http://zh.wikipedia.org/wiki/DOT%E8%AF%AD%E8%A8%80
关于 dot渲染工具Graphviz 传送门:http://www.graphviz.org/
扩展源码:https://github.com/Himer/dotarray