分享一个自动采集获取新闻实时热点的php脚本
今天就来分享一个自动采集获取搜狗,百度新闻实时热点的php脚本。获取后自动保存为txt文本,方便调用和查看~
- // www.Testyuming.cn Test玩站网
- // 搜狗百度热点采集生成:
- $strchulis="";
- $sgresult="";
- $baidustr1 = file_get_contents("http://top.baidu.com/buzz/top10.html");
- $baidustr2 = file_get_contents("http://top.baidu.com/buzz?b=11&c=513&fr=topcategory_c513");
- $baidustr3 = file_get_contents("http://top.baidu.com/buzz?b=344&c=513&fr=topcategory_c513");
- for ($x=1; $x<=3; $x++) {
- $sgstr1 = file_get_contents("http://top.sogou.com/hot/sevendsnews_".$x.".html");
- $sgstr2 = file_get_contents("http://top.sogou.com/hot/shishi_".$x.".html");
- $sgstr3 = file_get_contents("http://top.sogou.com/movie/all_".$x.".html");
- $sgstr4 = file_get_contents("http://top.sogou.com/tvplay/all_".$x.".html");
- $sgstr5 = file_get_contents("http://top.sogou.com/tvshow/all_".$x.".html");
- $sgstr6 = file_get_contents("http://top.sogou.com/animation/all_".$x.".html");
- $sgstr7 = file_get_contents("http://top.sogou.com/book/all_".$x.".html");
- $sgstr8 = file_get_contents("http://top.sogou.com/song/newsong_".$x.".html");
- $sgstr9 = file_get_contents("http://top.sogou.com/game/all_".$x.".html");
- $sgstr10 = file_get_contents("http://top.sogou.com/auto/all_".$x.".html");
- $sgstr11 = file_get_contents("http://top.sogou.com/people/all_".$x.".html");
- // for循环过滤搜狗
- for ($i=1; $i<=11; $i++) {
- preg_match_all('/<p class=\"p1\".*?>.*?<\/p>/ism', ${"sgstr".$i}, $matchestop);
- preg_match_all('/<p class=\"p3\".*?>.*?<\/p>/ism', ${"sgstr".$i}, $matchesbottom);
- $strtop = join("\r\n", $matchestop[0]);
- $strbottom = join("\r\n", $matchesbottom[0]);
- $sgresult.=$strtop.$strbottom;
- }
- $baidustr = mb_convert_encoding(${"baidustr".$x}, 'UTF-8', 'GB2312');
- preg_match_all('/<a class=\"list-title\".*?>.*?<\/a>/ism', $baidustr, $matches);
- $baidustr = join("\r\n", $matches[0]);
- $sgstrend=$sgresult.$baidustr;
- $strchuli = strip_tags($sgstrend);
- $strchulis.=$strchuli;
- }
- echo $strchulis;
- file_put_contents('testyuming/'.date("Y-m-d").'.txt', $strchulis);//存入txt
这个php脚本运行能获取百度的民生、体育、娱乐、搜狗的七天内3页、电影、电视剧、动漫、小说、音乐、游戏、汽车、人物的实时热点,一运行会在testyuming文件夹生成采集后的txt文本,如果没保存到文件夹,自己新建一个文件夹名为testyuming就行了~方便别人做一些关键词,或者查实时热点。
1.本站资源均为免登陆下载,直接扫码支付即可下载
2.站点支持支付宝扫码支付,更多支付方式联系客服QQ!
3.客服QQ:3013197813,822674928
4.本站大部分下载资源收集于网络,只做学习和交流使用,版权归原作者所有!
5. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
Test玩站网 » 分享一个自动采集获取新闻实时热点的php脚本
2.站点支持支付宝扫码支付,更多支付方式联系客服QQ!
3.客服QQ:3013197813,822674928
4.本站大部分下载资源收集于网络,只做学习和交流使用,版权归原作者所有!
5. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
Test玩站网 » 分享一个自动采集获取新闻实时热点的php脚本
常见问题FAQ
- 玩站小弟QQ没回怎么办?