2017-12-06 17:32:41 1421瀏覽
今天扣丁學堂給大家講解關于PHP培訓之模擬登陸抓取頁面內容的介紹,日常生活開發(fā)中經(jīng)常會遇到抓取某個頁面內容, 但是有時候某些頁面需要登陸才能訪問, 最常見的就是論壇, 這時候我們需要來使用curl模擬登陸。 大致思路:需要先請求提取 cookies 并保存,然后利用保存下來的這個cookies再次發(fā)送請求來獲取頁面內容,下面我們直接上代碼:
/**
* @Brief PHP讀取Curl模擬登陸, 獲取cookie, 帶cookie進行請求
* @Date: 2017/12/6
* @Time: 9:41
*/
//設置cookie保存位置
$cookieFile = dirname(__FILE__).'cookie.curl.tmp';
//第一步:獲取cookie
$url = 'http://m.dionly.net.cn';
$data = array(
'username' => 'pythontab',
'password' => 'pythontab',
);
//curl初始化
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
//設置為post請求
curl_setopt($ch, CURLOPT_POST, true);
//設置附帶返回header信息為空
curl_setopt($ch, CURLOPT_HEADER, 0);
//post數(shù)據(jù)
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
//cookie保存文件位置
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookieFile);
//設置數(shù)據(jù)返回作為變量儲存,而不是直接輸出
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
//執(zhí)行請求
$ret = curl_exec($ch);
//關閉連接
curl_close($ch);
//第二步:附帶cookie請求需要登陸的頁面
$url = http://m.dionly.net.cn/;
//curl初始化
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
//設置為post請求
curl_setopt($ch, CURLOPT_POST, true);
//設置附帶返回header信息為空
curl_setopt($ch, CURLOPT_HEADER, 0);
//設置cookie信息文件位置, 注意與第二步中的獲取不同,這里是讀取
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookieFile);
//設置數(shù)據(jù)返回作為變量儲存,而不是直接輸出
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
//執(zhí)行請求
$ret = curl_exec($ch);
//關閉連接
curl_close($ch);
//打印抓取內容
var_dump($ret);
這樣我們就抓取到了需要登陸才能訪問頁面的內容,
最后想要學習PHP開發(fā)技術的小伙伴不要猶豫了,扣丁學堂是你學習PHP技術的最佳選擇,想要PHP視頻教程的小伙伴現(xiàn)在就聯(lián)系我們的咨詢老師領取吧,機會總是留給有準備的人的! 扣丁學堂PHP技術交流群:374332265。
【關注微信公眾號免費領取丁豆獲取更多的學習資料】