国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > PHP > 正文

-phpQuery采集出現(xiàn)亂碼

2020-03-22 18:45:30
字體:
供稿:網(wǎng)友
在線等-phpQuery采集出現(xiàn)亂碼
關(guān)于采集電影天堂出現(xiàn)亂碼,求高手幫處理。。。。。。。。

header("Content-type: text/html; charset=utf-8");
set_time_limit(0);
require_once("../phpQuery/phpQuery.php");

function shootCodeBug($data){
$data=mb_convert_encoding($data,'ISO-8859-1','gb2312');
return mb_convert_encoding($data,'utf-8','GBK');
}

phpQuery::newDocumentHTML(shootCodeBug('http://www.dytt8.net/'));
phpQuery::$defaultCharset="gb2312";
$content = pq("#menu")->html();
phpQuery::$documents=array(); //清空緩存
------解決思路----------------------
這是你的使用方法不當(dāng)造成的
phpQuery 是利用 DOMDocument 做 HTML 解析的
而 DOMDocument::loadHTML 方法在載入 HTML 數(shù)據(jù)時,會根據(jù)文檔中的 標(biāo)記來識別文檔的字符集。
如果文檔中沒有這個標(biāo)記,則取默認(rèn)字符集 ISO-8859-1

因此,如果待處理的內(nèi)容沒有字符集聲明標(biāo)記時,應(yīng)自己附加上去
設(shè) $html 為待分析的內(nèi)容,則
if(! preg_match('/]+charset=/i', $html)) {
$charset = mb_check_encoding($html, 'utf-8') ? 'utf-8' : 'gbk';
$html = sprintf('%s', $charset, $html);
}
再給 phpQuery 處理就沒有問題了

當(dāng)然,你也可以整體的轉(zhuǎn)換成 utf-8 編碼的

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 江安县| 延津县| 樟树市| 金山区| 中卫市| 通城县| 永丰县| 合阳县| 云梦县| 赤壁市| 崇阳县| 祁阳县| 阿勒泰市| 兴隆县| 木兰县| 巴彦淖尔市| 铜山县| 太白县| 广州市| 静安区| 乡宁县| 五峰| 盐边县| 乾安县| 荣昌县| 保定市| 铜山县| 溧水县| 宜昌市| 万载县| 湘西| 昌邑市| 鲁甸县| 舒兰市| 永城市| 大化| 阿坝| 东乌珠穆沁旗| 五河县| 加查县| 陇西县|