国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數(shù)據(jù)庫 > MySQL > 正文

mysql 字符串長度計算實現(xiàn)代碼(gb2312+utf8)

2020-01-19 00:02:44
字體:
供稿:網(wǎng)友
PHP對中文字符串的處理一直困擾于剛剛接觸PHP開發(fā)的新手程序員。下面簡要的剖析一下PHP對中文字符串長度的處理:

PHP自帶的函數(shù)如strlen()、mb_strlen()都是通過計算字符串所占字節(jié)數(shù)來統(tǒng)計字符串長度的,一個英文字符占1字節(jié)。例:

$enStr = 'Hello,China!';
echo strlen($enStr); // 輸出:12

而中文則不然,做中文網(wǎng)站一般會選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站長的喜愛。gbk與utf-8對中文的編碼不同,導(dǎo)致中文在gbk與utf-8編碼下所占字節(jié)也有差異。

gbk編碼下每個中文字符所占字節(jié)為2,例:

$zhStr = '您好,中國!';
echo strlen($zhStr); // 輸出:12

utf-8編碼下每個中文字符所占字節(jié)為3,例:

$zhStr = '您好,中國!';
echo strlen($zhStr); // 輸出:18

那么如何計算這組中文字符串的長度呢?有人可能會說gbk下獲取中文字符串長度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字符串并不老實,99%的情況會以中英混合的情況出現(xiàn)。

這是WordPress中的一段代碼,主要思想就是先用正則將字符串分解為個體單元,然后再計算單元的個數(shù)即字符串的長度,代碼如下(只能處理utf-8編碼下的字符串):
復(fù)制代碼 代碼如下:

$zhStr = '您好,中國!';
$str = 'Hello,中國!';

// 計算中文字符串長度
function utf8_strlen($string = null) {
// 將字符串分解為單元
preg_match_all("/./us", $string, $match);
// 返回單元個數(shù)
return count($match[0]);
}
echo utf8_strlen($zhStr); // 輸出:6
echo utf8_strlen($str); // 輸出:9

utf8_strlen 主站蜘蛛池模板: 邹城市| 平山县| 惠东县| 定陶县| 莱西市| 秦皇岛市| 连平县| 垫江县| 威海市| 商丘市| 房产| 泊头市| 漠河县| 武邑县| 二连浩特市| 海晏县| 延川县| 安多县| 常山县| 北辰区| 雅安市| 灌南县| 行唐县| 五大连池市| 上杭县| 梁平县| 海林市| 莆田市| 景洪市| 南充市| 华容县| 双桥区| 应城市| 兖州市| 项城市| 蓝田县| 多伦县| 鱼台县| 莱阳市| 马尔康县| 安义县|