首页后端开发PHPPHP使用swoole实现多线程爬虫

PHP使用swoole实现多线程爬虫

时间2024-02-02 00:31:03发布访客分类PHP浏览905
导读:收集整理的这篇文章主要介绍了PHP使用swoole实现多线程爬虫,觉得挺不错的,现在分享给大家,也给大家做个参考。在swoole中,php可以借助其启动子进程的方式,实现php的多进程:<?php$s_time = time( ;ec...
收集整理的这篇文章主要介绍了PHP使用swoole实现多线程爬虫,觉得挺不错的,现在分享给大家,也给大家做个参考。在swoole中,php可以借助其启动子进程的方式,实现php的多进程:

?php$s_time = time();
    echo '开始时间:'.date('H:i:s',$s_time).PHP_EOL;
    //进程数$work_number=6;
     //$worker=[];
     //模拟地址$curl=[    'https://blog.csdn.net/feiwutudou',    'https://wiki.swoole.COM/wiki/page/215.htML',    'http://fanyi.baidu.com/?aldtyPE=16047#en/zh/manager',    'http://wanguo.net/Salecar/index.html',    'http://o.ngking.com/themes/mskin/login/LOGin.jsp',    'https://blog.csdn.net/marksinoberg/article/details/77816991'];
 //单线程模式// foreach ($curl as $v) {
    // echo curldeta($v);
// }
     //创建进程for ($i=0;
     $i  $work_number;
 $i++) {
    //创建多线程    $PRo=new swoole_process(function(swoole_process $work) use($i,$curl){
            //获取html文件        $content=curldeta($curl[$i]);
            //写入管道        $work->
    wrITe($content.PHP_EOL);
    }
    ,true);
        $pro_id=$pro->
    start();
        $worker[$pro_id]=$pro;
}
//读取管道内容foreach ($worker as $v) {
        echo $v->
    read().PHP_EOL;
}
 //模拟爬虫function curldeta($curl_arr){
    //file_get_contents    echo $curl_arr.PHP_EOL;
        file_get_contents($curl_arr);
}
     //进程回收swoole_process::wait();
     $e_time = time();
    echo '结束时间:'.date('H:i:s',$e_time).PHP_EOL;
     echo '所用时间:'.($e_time-$s_time).'秒'.PHP_EOL;
    ?>
    

多线程执行结果:

作为对比,单线程结果:

提升十分明显!

更多PHP相关知识,请访问PHP教程!

以上就是PHP使用swoole实现多线程爬虫的详细内容,更多请关注其它相关文章!

声明:本文内容由网友自发贡献,本站不承担相应法律责任。对本内容有异议或投诉,请联系2913721942#qq.com核实处理,我们将尽快回复您,谢谢合作!


若转载请注明出处: PHP使用swoole实现多线程爬虫
本文地址: https://pptw.com/jishu/596123.html
必看!TP6验证码验证失败的原因及解决方法 用PHP写一个计算器(附完整代码)

游客 回复需填写必要信息