在php中如果不仔細的去分析性能會發現file_get_contents與curl兩個同很多共同點的,他們都可以采集文件打開文件,但是如果仔細一對比會發現很多不同點,下面我們一起來看看file_get_contents與curl區別.
PHP中fopen,file_get_contents,curl函數的區別:
1.fopen /file_get_contents 每次請求都會重新做DNS查詢,并不對 DNS信息進行緩存。但是CURL會自動對DNS信息進行緩存,對同一域名下的網頁或者圖片的請求只需要一次DNS查詢,這大大減少了DNS查詢的次數,所以CURL的性能比fopen /file_get_contents 好很多.
2.fopen /file_get_contents 在請求HTTP時,使用的是http_fopen_wrapper,不會keeplive,而curl卻可以,這樣在多次請求多個鏈接時,curl效率會好一些.
3.fopen / file_get_contents 函數會受到php.ini文件中allow_url_open選項配置的影響,如果該配置關閉了,則該函數也就失效了,而curl不受該配置的影響.
4.curl 可以模擬多種請求,例如:POST數據,表單提交等,用戶可以按照自己的需求來定制請求,而fopen / file_get_contents只能使用get方式獲取數據.
file_get_contents 獲取遠程文件時會把結果都存在一個字符串中 fiels函數則會儲存成數組形式,因此,我還是比較傾向于使用curl來訪問遠程url,Php有curl模塊擴展,功能很是強大.
說了半天大家可能說性能怎么沒對比呢,那我們就來看看,最近需要獲取別人網站上的音樂數據,用了file_get_contents函數,但是總是會遇到獲取失敗的問題,盡管按照手冊中的例子設置了超時,可多數時候不會奏效,代碼如下:
- $config['context'] = stream_context_create(array(‘http’ => array(‘method’ => “GET”,
- ’timeout’ => 5//這個超時時間不穩定,經常不奏效
- )
- ));
這時候,看一下服務器的連接池,會發現一堆類似的錯誤,讓我頭疼萬分,代碼如下:
file_get_contents(http://Vevb.com):failed to open stream…
現在改用了curl庫,寫了一個函數替換,代碼如下:
- function curl_file_get_contents($durl){
- $ch = curl_init();
- curl_setopt($ch, CURLOPT_URL, $durl);
- curl_setopt($ch, CURLOPT_TIMEOUT, 5);
- curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);
- curl_setopt($ch, CURLOPT_REFERER,_REFERER_);
- curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
- $r = curl_exec($ch);
- curl_close($ch);
- return $r;
- }
如此,除了真正的網絡問題外,沒再出現任何問題,這是別人做過的關于curl和file_get_contents的測試,file_get_contents抓取google.com需用秒數.
- 2.31319094
- 2.30374217
- 2.21512604
- 3.30553889
- 2.30124092
- curl使用的時間:
- 0.68719101
- 0.64675593
- 0.64326
- 0.81983113
- 0.63956594
差距很大?呵呵,從我使用的經驗來說,這兩個工具不只是速度有差異,穩定性也相差很大,建議對網絡數據抓取穩定性要求比較高的朋友使用上面的 curl_file_get_contents函數,不但穩定速度快,還能假冒瀏覽器欺騙目標地址.
再看一個實例
后續貼出了curl和file_get_contents的對比結果,這邊除了curl與file_get_contents的性能對比,還包含了他們的性能對比,curl與file_get_contents性能對比PHP源代碼如下:
- <?php
- /**
- * 通過淘寶IP接口獲取IP地理位置
- * @param string $ip
- * @return: string
- **/
- function getCityCurl($ip)
- {
- $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip;
- $ch = curl_init();
- $timeout = 5;
- curl_setopt ($ch, CURLOPT_URL, $url);
- curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
- curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
- $file_contents = curl_exec($ch);
- curl_close($ch);
- $ipinfo=json_decode($file_contents);
- if($ipinfo->code=='1'){
- return false;
- }
- $city = $ipinfo->data->region.$ipinfo->data->city;
- return $city;
- }
- function getCity($ip)
- {
- $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip;
- $ipinfo=json_decode(file_get_contents($url));
- if($ipinfo->code=='1'){
- return false;
- }
- $city = $ipinfo->data->region.$ipinfo->data->city;
- return $city;
- }
- // for file_get_contents
- $startTime=explode(' ',microtime());
- $startTime=$startTime[0] + $startTime[1];
- for($i=1;$i<=10;$i++)
- { //開源代碼Vevb.com
- echo getCity("121.207.247.202")."</br>";
- }
- $endTime = explode(' ',microtime());
- $endTime = $endTime[0] + $endTime[1];
- $totalTime = $endTime - $startTime;
- echo 'file_get_contents:'.number_format($totalTime, 10, '.', "")." seconds</br>";
- //for curl
- $startTime2=explode(' ',microtime());
- $startTime2=$startTime2[0] + $startTime2[1];
- for($i=1;$i<=10;$i++)
- {
- echo getCityCurl('121.207.247.202')."</br>";
- }
- $endTime2 = explode(' ',microtime());
- $endTime2=$endTime2[0] + $endTime2[1];
- $totalTime2 = $endTime2 - $startTime2;
- echo "curl:".number_format($totalTime2, 10, '.', "")." seconds";
- ?>
測試訪問:http://m.survivalescaperooms.com
file_get_contents速度:4.2404510975 seconds
curl速度:2.8205530643 seconds
curl比file_get_contents速度快了30%左右,最重要的是服務器負載更低.
總結:file_get_contents處理頻繁小的時候,用它感覺挺好的,沒什么異常,如果你的文件被1k+人處理,那么你的服務器cpu就等著高升吧,所以建議自己和大家在以后寫php代碼的時候使用curl庫.
新聞熱點
疑難解答