国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python實現(xiàn)針對含中文字符串的截取功能示例

2020-01-04 16:47:17
字體:
供稿:網(wǎng)友

本文實例講述了Python實現(xiàn)針對含中文字符串的截取功能。分享給大家供大家參考,具體如下:

對于含多字節(jié)的字符串,進(jìn)行截斷的時候,要判斷截斷處是幾字節(jié)字符,不能將多字節(jié)從中分割,避免截斷后亂碼

下面給出utf8和gb18030上的實現(xiàn), 用任何一種都可以,可以先進(jìn)行轉(zhuǎn)碼,用encode, decode;

方法1:對utf8:

def subString(string,length):  if length >= len(string):        return string  result = ''  i = 0  p = 0  while True:        ch = ord(string[i])        #1111110x        if ch >= 252:            p = p + 6        #111110xx        elif ch >= 248:            p = p + 5        #11110xxx        elif ch >= 240:            p = p + 4        #1110xxxx        elif ch >= 224:            p = p + 3        #110xxxxx        elif ch >= 192:            p = p + 2        else:            p = p + 1        if p >= length:            break;        else:            i = p  return string[0:i]

方法2:對gb18030編碼

def cut_string_off(string,s_len):    if len(string)==0 or s_len <=0:        return string    elif len(string)==1 or s_len >= len(string):        return string    elif s_len < len(string):        len_num=0        while len_num < s_len:            tmp_c=ord(string[len_num])            if tmp_c >0 and tmp_c <=0x7F:                len_num+=1                continue            tmp_nextc=ord(string[len_num+1])            if tmp_c >= 0x81 and tmp_c <=0xFE and tmp_nextc>=0x40 and tmp_nextc<=0xFE:                len_num+=2                continue            else:                len_num +=1;                continue            break        tmp = string[0:len_num]#    print utf2gbk(tmp)    return tmp

 

希望本文所述對大家Python程序設(shè)計有所幫助。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 固镇县| 五常市| 济宁市| 大名县| 化州市| 定安县| 萍乡市| 报价| 洛阳市| 山东| 昂仁县| 顺平县| 贡嘎县| 腾冲县| 牟定县| 沿河| 宜君县| 岳普湖县| 万宁市| 松原市| 新丰县| 揭东县| 大田县| 陆良县| 运城市| 青冈县| 个旧市| 普兰县| 达日县| 梅河口市| 大新县| 义乌市| 横峰县| 嘉禾县| 华蓥市| 清新县| 乌什县| 仪陇县| 清丰县| 涞水县| 浮山县|