前言
gc的全称是garbage collection也就是垃圾回收的意思,在php中,是使用引用计数和回收周期来自动管理内存对象的,当一个对象被设置为null,或者没有任何指针指向时,他就会变成垃圾,被gc机制回收掉。
环境配置
php.ini终配置好xdebug,xdebug_debug_zval
是用来查看容器变量内容的函数
在php gc机制中,当程序终止时就会让变量的refcount
减1,如果refcount-1
为0的话,就会销毁回收该变量
引用计数
is_ref
表示该变量是否被引用,操作系统学的好的同学应该很容易理解该内容
# 运行结果
a: (refcount=2, is_ref=1)='f12'
$b是$a的引用,所以is_ref=1
,同时refcount
也会加1,因为此时是有两个变量的(两变量指向同一个地址),所以销毁时要让refcount
减2。
当变量是array类型时,也是一样的规则
"test", 1=>&$a);
xdebug_debug_zval("arr");
?>
# 运行结果
arr: (refcount=1, is_ref=0)=array (0 => (refcount=1, is_ref=0)='test', 1 => (refcount=2, is_ref=1)='f12')
如果我们在引用前将$a销毁会发生什么?
"test", 1=>&$a);
xdebug_debug_zval("a");
xdebug_debug_zval("arr");
?>
# 运行结果
a: (refcount=2, is_ref=1)=null
arr: (refcount=1, is_ref=0)=array (0 => (refcount=1, is_ref=0)='test', 1 => (refcount=2, is_ref=1)=null)
"test", 1=>&$a);
unset($a);
xdebug_debug_zval("a");
xdebug_debug_zval("arr");
?>
# 运行结果
a: no such symbol
arr: (refcount=1, is_ref=0)=array (0 => (refcount=1, is_ref=0)='test', 1 => (refcount=1, is_ref=1)='f12')
第一种情况,$a没有被销毁,因为在之后又引用了$a,所以$a只是指向了一个null,第二种情况就把$a销毁了
php gc在反序列化中的使用
一个简单的demo
num=$num;
echo "construct(".$num.")"."\n";
}
public function __destruct()
{
echo "destruct(".$this->num.")"."\n";
}
}
$a=new gc(1);
$b=new gc(2);
$c=new gc(3);
# 运行结果
construct(1)
construct(2)
construct(3)
destruct(3)
destruct(2)
destruct(1)
先创建的对象最后销毁,看看变量的内容情况:
可以看到refcount
为1,所以当程序结束时,减1就会被回收
如果我们不把new的gc对象赋值给$a会怎样?
num=$num;
echo "construct(".$num.")"."\n";
}
public function __destruct()
{
echo "destruct(".$this->num.")"."\n";
}
}
new gc(1);
$b=new gc(2);
$c=new gc(3);
# 运行结果
construct(1)
destruct(1)
construct(2)
construct(3)
destruct(3)
destruct(2)
可以看到第一个gc对象,创建完就被回收了,因为没被其它变量引用,它的refcount
一开始就是0,所以直接被回收
绕过exception异常
思路一
一个简单的demo:
num=$num;
}
public function __destruct()
{
echo "hello world!";
}
}
$a = new gc(1);
$ser = serialize($a);
$b = unserialize($ser);
throw new exception("f12 is bad");
正常来说会输出一个hello world!
,但是因为触发了异常,所以对象并没有被回收
我们修改一下代码:
num=$num;
}
public function __destruct()
{
echo "hello world!";
}
}
$a = array(0=>new gc(1),1=>1);
$ser = serialize($a);
echo $ser;
$ser = 'a:2:{i:0;o:2:"gc":1:{s:3:"num";i:1;}i:0;i:1;}';
$b = unserialize($ser);
throw new exception("f12 is bad");
这里我们我们修改序列化的内容,将$a[0]随便指向谁,从而使new的gc对象没有引用的变量,所以触发提前回收,跟上面举的直接new gc,并不赋值是一个道理
思路二
这种方法更加简单粗暴,我们只需要让序列化的数据出错,那么当反序列化时出错时,也会让该对象提前回收
num=$num;
}
public function __destruct()
{
echo "hello world!";
}
}
$a = new gc(1);
$ser = serialize($a);
echo $ser;
$ser = 'o:2:"gc":1:{s:3:"num";i:1;';
$b = unserialize($ser);
throw new exception("f12 is bad");
这里我们删去一个}
,依然输出了hello world!