国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 語言 > PHP > 正文

PHP用mb_string函數庫處理與windows相關中文字符及Win環境下開啟PHP Mb_String方法

2024-09-04 11:42:26
字體:
來源:轉載
供稿:網友

昨天想批處理以前下載的一堆文件,把文件里的關鍵內容用正則匹配出來,集中處理。在操作文件時遇到一個問題,就是windows操作系統中的編碼問題.

PHP用mb_string函數庫處理與windows相關中文字符

昨天想批處理以前下載的一堆文件,把文件里的關鍵內容用正則匹配出來,集中處理。在操作文件時遇到一個問題,就是windows操作系統中的編碼問題。

我們都知道windows中(當然是中文版),文件名和文件內容等編碼都是gbk,而我們在開發過程中,IDE里的編碼則是UTF-8,(這里不討論為什么等等問題,

只考慮怎么把編碼轉變成一樣的)所以導致我寫的UTF-8編碼的正則模式字符串中的中文在gbk編碼的文件中并不能正確匹配。

一開始,我并沒有什么辦法,試過把PHP腳本文件的編碼也改成GBK,也可以用,但是想到這種方法太low了,所以找一找PHP中有沒有函數可以滿足我的需求。

這時,我想到了以前在處理windows中的文件名時用的函數iconv(),其函數原型如下:

string iconv ( string $in_charset , string $out_charset , string $str )

Performs a character set conversion on the string str from in_charset to out_charset.

我們常使用:

$out_charset='utf-8';

$fileName=iconv($fileName,$out_charset,'gbk');

來處理文件名,將文件名改從gbk改為UTF-8而內容不變。

手冊翻譯附加:

如果你在輸出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能轉換為UTF-8的字符時,程序會自動替換為一個相似字符的UTF-8字符;

如果你在輸出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能轉換為UTF-8的字符時,程序會自動跳過這個字符。

如果你什么都沒加,就在遇到不能替換成UTF-8的字符時,替換會被中斷。

但是,我在用這個函數處理時,結果卻是這樣:

Warning:iconv(); Charset parameter exceeds the maxium allowed length of 64 characters in Call Stack

意思是iconv()函數能處理的最大字符數只有64,一般的文件名大小,而我的文件內容很顯然不止64個字符。

沒有辦法,我只好再次各種翻找別的函數。

直到我發現了mb_string函數庫,這個函數庫一般都在PHP環境里集成,我們可以在phpinfo()里找到它。

mbstring
 
Multibyte Support enabled
Multibyte string engine libmbfl

mb_string函數里有一個mb_convert_encoding()函數,可以將一個字符串的編碼改變,其函數原型如下:

string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] )

Converts the character encoding of string str to to_encoding from optionally from_encoding.

基原型跟iconv()函數差不多,只是它沒有對輸出函數的后綴修飾,它也沒有對字符串長度的明確限制。

而且我們看到$from_encoding是可選的,它可以自動識別源編碼。

因為找不到一個確切的無法轉碼的字符,也不知道它遇到無法轉碼的字符會怎么處理。

通過mb_convert_encoding()函數,將整個文件處理了一下,于是,問題順利解決。

最后介紹一下mb_string函數庫,它全名叫Multibyte String,它的很多方法都擴展自PHP自身的string函數庫,函數名在原函數的前面加了"mb_",這些函數除了擁有原函數的作用外,還在可選參數的最后加入了一個$encoding的可選參數,這個參數可以規定函數以什么樣的編碼方式來處理字符串。

例如strpos()函數,找到一個字符串在另一個字符串中的位置。

strpos("歡迎來訪問","問",0)返回的結果是12,因為腳本是UTF-8編碼,而將字符串轉為UTF-8編碼后,每個中文字符會占用3個字節。

而在mb_strpos()函數中,mb_strpos("歡迎來訪問","問",0,'utf-8')則會返回4,它會將字符串當作已經轉UTF-8的狀態執行。

而mb_strpos("歡迎來訪問","問",0,'gbk')會返回6

當然,它還有更多有特色的地方~

下面給大家介紹Windows環境下開啟PHP Mb_String方法

前幾天跑一個Php程序,需要轉字符編碼,可是一探服務器,居然說不支持Mb_String擴展。我查了Php的擴展庫里是有php_mbstring.dll這個文件的。

下面將打開的方法告訴大家

1.確保你的Windows/system32下有php_mbstring.dll這個文件,沒有就從你Php安裝目錄extensions里拷入Windows/system32里面。

2.在windows目錄下找到php.ini打開編輯,搜索mbstring.dll,找到

;extension=php_mbstring.dll

然后將前面的;號去掉,打開對組件的支持

3.重啟PHP服務(如果不會你可重新啟一下計算機)

4.完成

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 佛坪县| 敦化市| 定兴县| 富平县| 沂水县| 惠来县| 翁源县| 金昌市| 合川市| 绥滨县| 古田县| 成都市| 南溪县| 新丰县| 和龙市| 革吉县| 精河县| 哈巴河县| 台江县| 双桥区| 东山县| 廊坊市| 广宁县| 屏边| 田林县| 塔城市| 钦州市| 苏州市| 洛扎县| 桂东县| 赤水市| 兴文县| 义马市| 宁阳县| 明光市| 象山县| 拉萨市| 新沂市| 安阳市| 福泉市| 沙坪坝区|