關(guān)于文件編碼的檢測(cè),百度一下一大把都是,但是確實(shí)沒(méi)有能用的,下面是自己寫(xiě)了一個(gè)檢測(cè)函數(shù),希望對(duì)大家有所幫助。
關(guān)于文件編碼的檢測(cè),百度一下一大把都是,但是確實(shí)沒(méi)有能用的、很多人建議 mb_detect_encoding 檢測(cè),可是不知為何我這不成功,什么都沒(méi)輸出、看到有人寫(xiě)了個(gè)增強(qiáng)版,用 BOM 判斷的,我果斷就無(wú)視了,這東西完全不靠譜、最終根據(jù)PHP手冊(cè)里 mb_detect_encoding 函數(shù)下方的例子,自己寫(xiě)了一個(gè)檢測(cè)函數(shù),還包括自動(dòng)檢測(cè)編碼并按指點(diǎn)編碼讀取文件的函數(shù)、源碼獻(xiàn)上,不喜勿噴。
網(wǎng)上的方法我試過(guò)沒(méi)用才寫(xiě)的,說(shuō)不定環(huán)境不一樣導(dǎo)致的。
所以萬(wàn)一沒(méi)用,也別噴我,我只是共享想思路而已,代碼如下:
- <?php
- /**
- * 檢測(cè)文件編碼
- * @param string $file 文件路徑
- * @return string|null 返回 編碼名 或 null
- */
- function detect_encoding($file) {
- $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
- $str = file_get_contents($file);
- foreach ($list as $item) {
- $tmp = mb_convert_encoding($str, $item, $item);
- if (md5($tmp) == md5($str)) {
- return $item;
- }
- }
- return null;
- }
- /**
- * 自動(dòng)解析編碼讀入文件
- * @param string $file 文件路徑
- * @param string $charset 讀取編碼
- * @return string 返回讀取內(nèi)容
- */
- function auto_read($file, $charset='UTF-8') {
- $list = array('GBK', 'UTF-8', 'UTF-16LE', 'UTF-16BE', 'ISO-8859-1');
- $str = file_get_contents($file);
- foreach ($list as $item) {
- $tmp = mb_convert_encoding($str, $item, $item);
- if (md5($tmp) == md5($str)) {
- return mb_convert_encoding($str, $charset, $item);
- }
- }
- return "";
- }
新聞熱點(diǎn)
疑難解答