php抓取https的內容的代碼
大家有時候需要獲取https網頁的內容,下面得方法,可以參考下。就跟隨本站小編一起去了解下吧,想了解更多相關信息請持續關注我們應屆畢業生考試網!
直接用file_get_contents,會報錯;
複製代碼 代碼如下:
$url = (");
file_get_contents($url);
錯誤:
Warning: file_get_contents() [-get-contents]: failed to open stream: No such file or directory in D:wampwwwgrabber_ on line 3
用curl的方式是可以的:
複製代碼 代碼如下:
$url = ();
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
$result = curl_exec($ch);
print_r($result);
?>
重點是以下兩句:
複製代碼 代碼如下:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
如對本文有疑問,請提交到交流社區,廣大熱心網友會為你解答!! 點擊進入社區
為方便説明,先上代碼吧
複製代碼 代碼如下:
/**
* curl POST
*
* @param string url
* @param array 數據
* @param int 請求超時時間
* @param bool HTTPS時是否進行嚴格認證
* @return string
*/
function curlPost($url, $data = array(), $timeout = 30, $CA = true){
$cacert = getcwd() . '/'; //CA根證書
$SSL = substr($url, 0, 8) == "https://" ? true : false;
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout-2);
if ($SSL && $CA) {
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true); // 只信任CA頒佈的證書
curl_setopt($ch, CURLOPT_CAINFO, $cacert); // CA根證書(用來驗證的網站證書是否是CA頒佈)
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2); // 檢查證書中是否設置域名,並且是否與提供的主機名匹配
} else if ($SSL && !$CA) {
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); // 信任任何證書
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 檢查證書中是否設置域名
}
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:')); //避免data數據過長問題
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
//curl_setopt($ch, CURLOPT_POSTFIELDS, http_build_query($data)); //data with URLEncode
$ret = curl_exec($ch);
//var_dump(curl_error($ch)); //查看報錯信息
curl_close($ch);
return $ret;
}
如果URL地址是https打頭,那就走SSL,否則就走普通的HTTP協議。
是否走HTTPS的話就安全了嗎?其實SSL也有不同的驗證程度。
例如需不需要驗證證書中的公用名呢?(BTW:公用名(Common Name)一般來講就是填寫你將要申請SSL證書的域名 (domain)或子域名(sub domain)。)
需要驗證主機名嗎?
是任何證書都信任呢還是隻信任CA頒佈的呢?
(我擦嘞,電池快沒點了,只撿關鍵地兒説了 - -|||)
如果網站SSL證書買的是CA的(通常比較貴),那麼訪問時可以使用比較嚴格的認證,即:
複製代碼 代碼如下:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, true); // 只信任CA頒佈的.證書
curl_setopt($ch, CURLOPT_CAINFO, $cacert); // CA根證書(用來驗證的網站證書是否是CA頒佈)
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 2); // 檢查證書中是否設置域名,並且是否與提供的主機名匹配
如果網站的證書是自己生成的,或者是網上的小機構申請的,那麼訪問時如果使用嚴格認證則不會通過,直接返回false。(對了,返回false時可以打印curl_error($ch)查看具體錯誤信息。)此時可以根據情況通過降低驗證程度來保證正常訪問,例如:
複製代碼 代碼如下:
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false); // 信任任何證書
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1); // 檢查證書中是否設置域名(為0也可以,就是連域名存在與否都不驗證了)
平時我們使用瀏覽器訪問各個https網站時,有時會遇到證書不受信的提示,其實就是因為這些網站的證書不是正規CA機構頒佈的。
市面上各種瀏覽器中都內置了CA根證書列表信息,訪問有CA頒佈證書的網站時,會根據根證書驗證這些網站的證書,所以就不會有這個提示了。
關於CA根證書文件,其實就是包含了各個主要CA機構的公鑰證書,用來驗證網站的證書是否是這些機構頒發的。
這裏的這個文件是來源於mozilla的源碼樹,又轉換成PEM格式證書文件。(大家可以到這裏下載現成的)
最後説一個和SSL無關的東西:
複製代碼 代碼如下:
curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:'));
這個主要是為了解決POST時數據過長問題
-
2017年PHP錯誤總結範文
導語:如果你還是PHP新手的話,不妨就找些PHP錯誤點來看看。下面的是本站小編為大家蒐集的2017年PHP錯誤總結,供大家參考。錯誤總結PHP-不斷更新(新手必看)做開發請開啟全部錯誤提示:error_reporting=E_ALL|E_STRICT屏蔽錯誤提示等於掩耳盜鈴。代碼寫規範,錯誤少一半...
-
數據庫設計和訪問數據庫的 PHP 代碼中出現的五個常見問題
導語:您可以用很多的方式創建數據庫設計、數據庫訪問和基於數據庫的PHP業務邏輯代碼,但最終一般以錯誤告終。本文説明了數據庫設計和訪問數據庫的PHP代碼中出現的五個常見問題,以及在遇到這些問題時如何修復它們。問題1:直接使用MySQL一個常見問題是較老的PHP代碼...
-
增強PHP程序安全的函數
安全是編程非常重要的一個方面。在任何一種編程語言中,都提供了許多的函數或者模塊來確保程序的安全性。在現代網站應用中,經常要獲取來自世界各地用户的輸入,但是,我們都知道“永遠不能相信那些用户輸入的數據”。所以在各種的Web開發語言中,都會提供保證用户輸入...
-
如何寫出高質量的PHP程序
現在的PHP程序員都在追求所謂的高性能,但高性能並不代表是高質量,什麼是高質量的PHP程序呢?我認為,高質量的PHP程序首先得具備以下的要素,就跟隨本站小編一起去了解下吧,想了解更多相關信息請持續關注我們應屆畢業生考試網!一、安全無論程序寫這是一個很老的話題了,...