国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

php自動獲取字符串編碼函數mb_detect_encoding

2024-05-04 23:18:32
字體:
來源:轉載
供稿:網友

當在php中使用mb_detect_encoding函數進行編碼識別時,很多人都碰到過識別編碼有誤的問題,例如對與GB2312和UTF- 8,或者UTF-8和GBK(這里主要是對于cp936的判斷),網上說是由于字符短是,mb_detect_encoding會出現誤判。
例如:

復制代碼 代碼如下:


$encode = mb_detect_encoding($keytitle, array("ASCII",'UTF-8′,"GB2312′,"GBK",'BIG5′));
if ($encode == “UTF-8″){
$keytitle = iconv("UTF-8″,"GBK",$keytitle);
}


這段代碼的作用是檢測字符串的編碼是否UTF-8,是的話就轉換為GBK。
可是當 $keytitle = “%D0%BE%C6%AC”;時。檢測結果卻是UTF-8.這個bug其實不算是bug,寫程序時也不應當過于依賴mb_detect_encoding,當字符串較短時,檢測結果產生偏差的可能性很大。
怎么解決呢,我的辦法是:

復制代碼 代碼如下:


$encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK','UTF-8');


三個參數分別是:被檢測的輸入變量、編碼方式的檢測順序(一旦為真,后面自動忽略)、strict模式
對編碼檢測的順序進行調整,將最大可能性放在前面,這樣減少被錯誤轉換的機會。
一般要先排gb2312,當有GBK和UTF-8時,需要將常用的排列到前面。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 寿光市| 太仆寺旗| 阳西县| 漳浦县| 荔波县| 邓州市| 洞头县| 滨海县| 彭阳县| 漳浦县| 滁州市| 蓬溪县| 新干县| 繁峙县| 长葛市| 绥宁县| 宁化县| 三门县| 永和县| 新邵县| 商南县| 安庆市| 涪陵区| 新密市| 阜新市| 天峨县| 泸水县| 庄浪县| 荃湾区| 视频| 灵石县| 侯马市| 乌鲁木齐县| 当雄县| 周口市| 会泽县| 江阴市| 汝州市| 夏邑县| 黄梅县| 三门县|