PHP使用swoole实现多线程爬虫
导读:收集整理的这篇文章主要介绍了PHP使用swoole实现多线程爬虫,觉得挺不错的,现在分享给大家,也给大家做个参考。在swoole中,php可以借助其启动子进程的方式,实现php的多进程:<?php$s_time = time( ;ec...
收集整理的这篇文章主要介绍了PHP使用swoole实现多线程爬虫,觉得挺不错的,现在分享给大家,也给大家做个参考。在swoole中,php可以借助其启动子进程的方式,实现php的多进程:?php$s_time = time();
echo '开始时间:'.date('H:i:s',$s_time).PHP_EOL;
//进程数$work_number=6;
//$worker=[];
//模拟地址$curl=[ 'https://blog.csdn.net/feiwutudou', 'https://wiki.swoole.COM/wiki/page/215.htML', 'http://fanyi.baidu.com/?aldtyPE=16047#en/zh/manager', 'http://wanguo.net/Salecar/index.html', 'http://o.ngking.com/themes/mskin/login/LOGin.jsp', 'https://blog.csdn.net/marksinoberg/article/details/77816991'];
//单线程模式// foreach ($curl as $v) {
// echo curldeta($v);
// }
//创建进程for ($i=0;
$i $work_number;
$i++) {
//创建多线程 $PRo=new swoole_process(function(swoole_process $work) use($i,$curl){
//获取html文件 $content=curldeta($curl[$i]);
//写入管道 $work->
wrITe($content.PHP_EOL);
}
,true);
$pro_id=$pro->
start();
$worker[$pro_id]=$pro;
}
//读取管道内容foreach ($worker as $v) {
echo $v->
read().PHP_EOL;
}
//模拟爬虫function curldeta($curl_arr){
//file_get_contents echo $curl_arr.PHP_EOL;
file_get_contents($curl_arr);
}
//进程回收swoole_process::wait();
$e_time = time();
echo '结束时间:'.date('H:i:s',$e_time).PHP_EOL;
echo '所用时间:'.($e_time-$s_time).'秒'.PHP_EOL;
?>
多线程执行结果:
作为对比,单线程结果:
提升十分明显!
更多PHP相关知识,请访问PHP教程!
以上就是PHP使用swoole实现多线程爬虫的详细内容,更多请关注其它相关文章!
声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!
若转载请注明出处: PHP使用swoole实现多线程爬虫
本文地址: https://pptw.com/jishu/596123.html
