首页后端开发PHPphp8的底层内核源码-数组,是什么意思?

php8的底层内核源码-数组,是什么意思?

时间2024-03-23 11:40:03发布访客分类PHP浏览724
导读:这篇文章主要为大家详细介绍了php8的底层内核源码-数组,是什么意思?,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望对大家学习或工作能有帮助。 本篇文章给大家介绍《解析PHP8底层内核源码-...
这篇文章主要为大家详细介绍了php8的底层内核源码-数组,是什么意思?,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望对大家学习或工作能有帮助。

本篇文章给大家介绍《解析PHP8底层内核源码-数组(二)》。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。

相关文章推荐:《解析PHP8底层内核源码-数组(一)》《解析PHP8底层内核源码-数组(三)》《解析PHP8底层内核源码-数组(四)》

zend_array 在 PHP中 被分为两种

1.packed array
2.hash array

在上文中 补齐了zend_array的 所有值的 注释

其实源码里顺序和我上面的稍微不一样 我觉得我上面的顺序理解起来更合理

//源码里的代码
typedef struct _zend_array HashTable;

struct _zend_array {
    
zend_refcounted_h gc;

union {

struct {

ZEND_ENDIAN_LOHI_4(
zend_uchar    flags,
zend_uchar    _unused,
zend_uchar    nIteratorsCount,
zend_uchar    _unused2)
}
     v;
    
uint32_t flags;

}
     u;
    
uint32_t          nTableMask;
    
Bucket           *arData;
    
uint32_t          nNumUsed;
    
uint32_t          nNumOfElements;
    
uint32_t          nTableSize;
    
uint32_t          nInternalPointer;
    
zend_long         nNextFreeElement;
    
dtor_func_t       pDestructor;

}
    ;

//我调换下顺序后的代码
struct _zend_array {
    
zend_refcounted_h gc;
 
 ///  gc  占用8个字节 用于引用计数和  字符串类型的记录
union {

struct {

ZEND_ENDIAN_LOHI_4(
zend_uchar    flags,
// flags   8位的无符号字符, 最大值为255   标记HashTable用 PHP8 中有6个值
zend_uchar    _unused,
zend_uchar    nIteratorsCount,
//迭代器计数。foreach语句会在全局变量EG中创建一个迭代器,
//迭代器包含正在遍历的HashTable和游标信息。
//nIteratorsCount记录了当前runtime正在迭代当前HashTable的迭代器的数量。
zend_uchar    _unused2)
}
     v;
    
  //这里有点不一样 看陈雷大佬书中 v结构体还包括 u.v.nApplyCount和u.v.consistency
uint32_t flags;

             //
}
     u;
    
// u是是一个联合体。占用4个字节。
//可以存储一个uint32_t类型的flags,也可以存储由4个unsigned char组成的结构体v,
//这里的宏ZEND_ENDIAN_LOHI_4是为了兼容不同操作系统的大小端,可以忽略。
Bucket           *arData;
    
//HashTable中存储数据的单元的指针。
//  用来存储key和value以及辅助信息的容器。
uint32_t          nTableSize;
    
//    HashTable的大小。表示arData指向的bucket数组的大小,即所有bucket的数量。
//该字段取值始终是2n,最小值是8,最大值在64位系统中是0x80000000(2的31次幂)。
uint32_t          nNumUsed;
    
//指所有已使用bucket的数量,包括有效bucket和无效bucket的数量
uint32_t          nNumOfElements;
    
//有效bucket的数量。该值总是小于或等于nNumUsed
uint32_t          nTableMask;
    
//索引大小。一般值为  -nTableSize。
uint32_t          nInternalPointer;
    
//全局默认游标。reset/key/current/next/prev等宏 和操作都会用到
zend_long         nNextFreeElement;
    
//下一个插入的元素的key的下标  
//比如  当$a[] = 1  nNextFreeElement =1  
dtor_func_t       pDestructor;
    
//指向一个函数   typedef void (*dtor_func_t)(zval *pDest);

//可以看出是pDest是zval结构指针二级指针,
//为什么会是二级指针,因为c语言函数传递都是值传递,要改变指针值只能将指针地址传入
//当bucket元素被更新或者被删除时,会对bucket的value调用该函数,
//如果value是引用计数的类型,那么会对value引用计数减1,进而引发可能的gc。
}
    ;

用understand 工具 生成的成员变量图如下

展开全部后 如下

zend_array 结构体 member

可以看出 其实核心就是 z_val +zend_string +zend_refcounted_h+Bucket 层层相扣

其中 Bucket 存储数组的 关键信息

typedef struct _Bucket {
    
zval              val;
       //数组的值 ( 复习下 zval只有16个字节)
zend_ulong         h;
         // key的 h  值
zend_string      *key;
      //当数组为 hash_array时候 会用到 也就是 key的值  
}
     Bucket;
    

不管 数组类型是 packed_array 还是hash_array 最终都会存储在 Bucket中

当 key全是数字key 并且 key按插入顺序递增的时候 数组类型为packed_array

packed array的特性

  1. 不需要索引数组
  2. 用不到 key
  3. 不带key的 数组h 值 直接等于bucket中空间的排序值 从0开始
  4. key-value对的数组 h 值 等于 key的内容

其中第三条和第四条你可以理解为PHP中数组如果不写key 那么就默认key就从0开始依次排序

$a =array(1,2,3);
      // packed array
$b =array(1=>
    'a',3=>
    'b',5=>
    'c');
     //packed array

bucket 数组前 会有索引数组

当为packed array 时 索引数组得大小一直为 2 因为用不到它

上面当 $a 对应的 zend_array里的内容为

$a 的zend_array

nTableSize; 表示arData指向的bucket数组的大小,即所有bucket的数量。=数组的总大小

nNumUsed; 指所有已使用bucket的数量,包括有效bucket和无效bucket的数量

bucket会有三种状态 有效 无效 已使用

nNumOfElements; 有效bucket的数量。

所以 nNumOfElements+nNumUsed =nTableSize

nTableMask; 索引大小。 因为 packed array 没有用到索引 所以永远为-2

nNextFreeElement; 下一个插入的元素的key的下标

packed array 利用了bucket数组的连续性特点,对于某些只有数字key的场景进行的优化。由于不再需要索引数组,从内存空间上节省了(nTableSize-2 )* sizeof(uint32_t) 个字节。另外,由于存取bucket是直接操作bucket数组,在性能上也有所提升。

如果 未满足 packed array 的条件 在PHP中 数组用 hash_array表示

所有 key 值不是数字的都用hash_array 表示

$c =array('x'=>
    1,'y'=>
    2,'z'=>
    3,'a'=>
    0);
    

上面的$c 会被用 hash_array 表示

bucket如下

$c 的 bucket

zend_array如下

$c 的 zend_array

nTableSize; 表示arData指向的bucket数组的大小,即所有bucket的数量。=8

nNumUsed; 指所有已使用bucket的数量,包括有效bucket和无效bucket的数量=4

bucket会有三种状态 有效 无效 已使用

nNumOfElements; 有效bucket的数量。=4

所以 nNumOfElements+nNumUsed =nTableSize

nTableMask; 索引大小。 -8

nNextFreeElement; 下一个插入的元素的key的下标 hash_array 用不到 永远为0


通过以上内容的阐述,相信大家对“php8的底层内核源码-数组,是什么意思?”已经有了进一步的了解,更多相关的问题,欢迎关注网络或到官网咨询客服。

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!

数组

若转载请注明出处: php8的底层内核源码-数组,是什么意思?
本文地址: https://pptw.com/jishu/651315.html
Python的两种格式化输出哪个好,不同在哪? Oracle表添加、删除、截断、合并分区的方法是什么

游客 回复需填写必要信息