国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > PHP > 正文

PHP中使用file_get_contents抓取網(wǎng)頁中文亂碼問題解決方法

2024-05-04 23:29:02
字體:
供稿:網(wǎng)友
這篇文章主要介紹了PHP中使用file_get_contents抓取網(wǎng)頁中文亂碼問題解決方法,可以通過使用curl配置gzip選項來解決,具有一定的參考借鑒價值,需要的朋友可以參考下
 
 

本文實例講述了PHP中使用file_get_contents抓取網(wǎng)頁中文亂碼問題解決方法。分享給大家供大家參考。具體方法如下:

file_get_contents函數(shù)本來就是一個非常優(yōu)秀的php自帶本地與遠程文件操作函數(shù),它可以讓我們不花吹揮之力把遠程數(shù)據(jù)直接下載,但我在使用它讀取網(wǎng)頁時會碰到有些頁面是亂碼了,這里就來給各位總結(jié)具體的解決辦法.

根據(jù)網(wǎng)上有朋友介紹說原因可能是服務(wù)器開了GZIP壓縮,下面是用firebug查看我的網(wǎng)站的頭信息,Gzip是開了的,請求頭信息原始頭信息,代碼如下:

復制代碼代碼如下:
Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Encoding gzip, deflate 
Accept-Language zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3 
Connection keep-alive 
Cookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.1326850415.887.3.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E4%BB%BB%E4%BD%95%E9%A1%B9%E7%9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%20site%3Awww.nowamagic.net; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401 
Host m.survivalescaperooms.com 
User-Agent Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0

可以從header信息中找到 Content-Encoding 項是 Gzip.

 

解決辦法比較簡單,就是用 curl 代替 file_get_contents 去獲取,然后在 curl 配置參數(shù)中加一條,代碼如下:

復制代碼代碼如下:
curl_setopt($ch, CURLOPT_ENCODING, "gzip");

 

今天用 file_get_contents 抓圖片的時候,開始沒發(fā)現(xiàn)這個問題,廢了老大勁才找出來.

使用自帶的zlib庫,如果服務(wù)器已經(jīng)裝了zlib庫,用下面的代碼可以輕易解決亂碼問題,代碼如下:

復制代碼代碼如下:
$data = file_get_contents("compress.zlib://".$url);

 

希望本文所述對大家的PHP程序設(shè)計有所幫助。


發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 木里| 漳浦县| 奉新县| 喜德县| 铜鼓县| 呼玛县| 栾川县| 社旗县| 大连市| 蓝田县| 东阿县| 浦县| 青铜峡市| 缙云县| 资中县| 阿拉尔市| 霍邱县| 亳州市| 清水河县| 永年县| 轮台县| 青河县| 化隆| 钦州市| 措美县| 宝丰县| 麻城市| 泰来县| 上思县| 沅陵县| 哈巴河县| 油尖旺区| 永定县| 睢宁县| 曲阜市| 渭南市| 五河县| 汶川县| 成安县| 吉林省| 米林县|