国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

詳解PHP中strlen和mb_strlen函數的區別

2024-05-04 23:21:57
字體:
來源:轉載
供稿:網友

在PHP里有兩個計算字符串個數的函數
一個是 strlen,一個是mb_strlen;
先來看看手冊中的定義
strlen
strlen — 獲取字符串長度
int strlen ( string $string )
返回給定的字符串 string 的長度。

mb_strlen
int mb_strlen ( string $str [, string $encoding ] )
返回給定的字符串 string 的長度。
encoding參數為字符編碼。如果省略,則使用內部字符編碼。

這么看除了mb_strlen可以傳遞一個字符編碼好像沒有其他區別,下面通過例子,講解這兩者之間的區別。
先看例子:

復制代碼 代碼如下:


<?php    //測試時文件的編碼方式要是UTF8   
$str='中文a字1符';   
echo strlen($str).'<br>';//14   
echo mb_strlen($str,'utf8').'<br>';//6   
echo mb_strlen($str,'gbk').'<br>';//8   
echo mb_strlen($str,'gb2312').'<br>';//10   
?>



結果分析:在strlen計算時,對待一個UTF8的中文字符是3個長度,所以“中文a字1符”長度是3*4+2=14,在mb_strlen計算時,選定內碼為UTF8,則會將一個中文字符當作長度1來計算,所以“中文a字1符”長度是6 .
利用這兩個函數則可以聯合計算出一個中英文混排的串的占位是多少(一個中文字符的占位是2,英文字符是1)

復制代碼 代碼如下:

echo (strlen($str) + mb_strlen($str,'UTF8')) / 2; 



例如 “中文a字1符” 的strlen($str)值是14,mb_strlen($str)值是6,則可以計算出“中文a字1符”的占位是10。

復制代碼 代碼如下:

echo mb_internal_encoding();



PHP內置的字符串長度函數strlen無法正確處理中文字符串,它得到的只是字符串所占的字節數。對于GB2312的中文編碼,strlen得到的值是漢字個數的2倍,而對于UTF-8編碼的中文,就是3倍的差異了(在 UTF-8編碼下,一個漢字占3個字節)。

采用mb_strlen函數可以較好地解決這個問題。mb_strlen的用法和 strlen類似,只不過它有第二個可選參數用于指定字符編碼。例如得到UTF-8的字符串$str長度,可以用 mb_strlen($str,'UTF-8')。如果省略第二個參數,則會使用PHP的內部編碼。內部編碼可以通過 mb_internal_encoding()函數得到。
需要注意的是,mb_strlen并不是PHP核心函數,Windows 下使用前需要確保在php.ini中加載了php_mbstring.dll,即確保“extension=php_mbstring.dll”這一行存在并且沒有被注釋掉,否則會出現未定義函數的問題。Linux 下需要編譯這個擴展。
 

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 兴安县| 宜丰县| 荆门市| 宜宾县| 康乐县| 娱乐| 渭南市| 洪雅县| 子洲县| 海林市| 彭山县| 滨州市| 济源市| 当阳市| 昌黎县| 屯留县| 龙游县| 阿克陶县| 兴山县| 乌兰察布市| 资兴市| 泰顺县| 神农架林区| 治县。| 大同市| 长寿区| 临桂县| 玛纳斯县| 栾城县| 东山县| 崇州市| 冕宁县| 沐川县| 天柱县| 嘉荫县| 雷波县| 郯城县| 抚顺县| 江门市| 平武县| 东安县|