国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

php截取字符串之截取utf8或gbk編碼的中英文字符串示例

2024-05-04 23:22:05
字體:
來源:轉載
供稿:網友

微博的發言有字數限制,其計數方式是,中文算2個,英文算1個,全角字符算2個,半角字符算1個。
php中自帶strlen是返回的字節數,對于utf8編碼的中文返回時3個,不滿足需求。
mb_strlen 可以根據字符集計算長度,比如utf8的中文計數為1,但這不符合微博字數限制需求,中文必須計算為2才可以。
google了下,找到一個discuz中截取各種編碼字符的類,改造了下,已經測試通過.其中參數$charset 只支持gbk與utf-8。

復制代碼 代碼如下:


$a = "s@@你好";
var_dump(strlen_weibo($a,'utf-8'));

結果輸出為8,其中字母s計數為1,全角@計數為2,半角@計數為1,兩個中文計數為4。源碼如下:

復制代碼 代碼如下:


function strlen_weibo($string, $charset='utf-8')
{
    $n = $count = 0;
    $length = strlen($string);
    if (strtolower($charset) == 'utf-8')
    {
        while ($n < $length)
        {
            $currentByte = ord($string[$n]);
            if ($currentByte == 9 ||
                $currentByte == 10 ||
                (32 <= $currentByte && $currentByte <= 126))
            {
                $n++;
                $count++;
            } elseif (194 <= $currentByte && $currentByte <= 223)
            {
                $n += 2;
                $count += 2;
            } elseif (224 <= $currentByte && $currentByte <= 239)
            {
                $n += 3;
                $count += 2;
            } elseif (240 <= $currentByte && $currentByte <= 247)
            {
                $n += 4;
                $count += 2;
            } elseif (248 <= $currentByte && $currentByte <= 251)
            {
                $n += 5;
                $count += 2;
            } elseif ($currentByte == 252 || $currentByte == 253)
            {
                $n += 6;
                $count += 2;
            } else
            {
                $n++;
                $count++;
            }
            if ($count >= $length)
            {
                break;
            }
        }
        return $count;
    } else
    {
        for ($i = 0; $i < $length; $i++)
        {
            if (ord($string[$i]) > 127)
            {
                $i++;
                $count++;
            }
            $count++;
        }
        return $count;
    }
}

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 茌平县| 深泽县| 乐安县| 丹凤县| 凤庆县| 香格里拉县| 新源县| 桐城市| 和静县| 北票市| 玉环县| 环江| 秦皇岛市| 陆川县| 凤山县| 松溪县| 金堂县| 苏尼特左旗| 沈阳市| 绿春县| 信丰县| 关岭| 民乐县| 永嘉县| 太白县| 昔阳县| 临清市| 临颍县| 城口县| 桐梓县| 凭祥市| 宿迁市| 永济市| 普格县| 海南省| 普格县| 阿克陶县| 淳安县| 湖口县| 乐山市| 阜新|