国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > WEB開發 > 正文

Gb2312轉utf-8(vbs+js)

2024-04-27 13:55:57
字體:
來源:轉載
供稿:網友

昨天看了一下cocoon counter的代碼,發現里面是用vbScript轉的,費了以上午時間來研究,還是被搞得暈糊糊- -

他的vb轉換函數是這樣的:


Function DeCodeAnsi(s)
Dim i, sTmp, sResult, sTmp1
sResult = ""
For i=1 To Len(s)
If Mid(s,i,1)="%" Then
sTmp = "&H" & Mid(s,i+1,2)
If isNumeric(sTmp) Then
If CInt(sTmp)=0 Then
i = i + 2
ElseIf CInt(sTmp)>0 And CInt(sTmp)<128 Then
sResult = sResult & Chr(sTmp)
i = i + 2
Else
If Mid(s,i+3,1)="%" Then
sTmp1 = "&H" & Mid(s,i+4,2)
If isNumeric(sTmp1) Then
sResult = sResult & Chr(CInt(sTmp)*16*16 + CInt(sTmp1))
i = i + 5
End If
Else
sResult = sResult & Chr(sTmp)
i = i + 2
End If
End If
Else
sResult = sResult & Mid(s,i,1)
End If
Else
sResult = sResult & Mid(s,i,1)
End If
Next
DeCodeAnsi = sResult
End Function

也就是用chr()函數把10進制的ANSI 字符代碼轉換成文字。文字本身應該是unicode,也就是vbs自動完成了gb-utf的轉換,下面是我測試的一些數據:
測試代碼:(需要把上面的代碼加在前面)

<SCRIPT RUNAT=SERVER LANGUAGE=javaSCRIPT>
Response.write("<br/>strx = chr(54992):");
Response.write(strx);
Response.write("<br/>strx.charCodeAt(0):");
Response.write(strx.charCodeAt(0));
Response.write("<br/>/"中/".charCodeAt(0):");
Response.write("中".charCodeAt(0));
Response.write("<br/>escape(strx):");
Response.write(escape(strx));
Response.write("<br/>encodeURI(strx):");
Response.write(encodeURI(strx));
Response.write("<br/>escape(/"中/"):");
Response.write(escape("中"));
Response.write("<br/>String.fromCharCode(20013):");
Response.write(String.fromCharCode(20013));
</SCRIPT>


分別調整文件存儲格式,codepage,charset得到的結果:

文件為ansi格式:
codepage=936:
Response.Charset = "gb2312";
strx = chr(54992)
strx:中
strx.charCodeAt(0):20013
"中".charCodeAt(0):20013
escape(strx):%u4E2D
encodeURI(strx):%E4%B8%AD
escape("中"):%u4E2D
String.fromCharCode(20013):中

Response.Charset = "utf-8";
strx = chr(54992)
strx:֐
strx.charCodeAt(0):20013
"֐".charCodeAt(0):20013
escape(strx):%u4E2D
encodeURI(strx):%E4%B8%AD
escape("֐"):%u4E2D
String.fromCharCode(20013):֐

codepage=65001:
Response.Charset = "gb2312";
strx = chr(54992)
strx:涓
strx.charCodeAt(0):20013
"".charCodeAt(0):-1.#IND
escape(strx):%u4E2D
encodeURI(strx):%E4%B8%AD
escape(""):
String.fromCharCode(20013):涓

Response.Charset = "utf-8";
strx = chr(54992)
strx:㝤
strx.charCodeAt(0):14180
"".charCodeAt(0):-1.#IND
escape(strx):%u3764
encodeURI(strx):%E3%9D%A4
escape(""):
String.fromCharCode(20013):中

文件為utf-8格式:
codepage=65001:
Response.Charset = "gb2312";
strx = chr(54992)
strx:涓
strx.charCodeAt(0):20013
"涓?.charCodeAt(0):20013
escape(strx):%u4E2D
encodeURI(strx):%E4%B8%AD
escape("涓?):%u4E2D
String.fromCharCode(20013):涓

Response.Charset = "utf-8";
strx = chr(54992)
strx:中
strx.charCodeAt(0):20013
"中".charCodeAt(0):20013
escape(strx):%u4E2D
encodeURI(strx):%E4%B8%AD
escape("中"):%u4E2D
String.fromCharCode(20013):中

codepage=936:
Active Server Pages 錯誤 'asp 0245'
代碼頁值的混合使用
/referer_alapha/test2.asp,行 1
指定的 @CODEPAGE 值與包括文件的 CODEPAGE 或文件的保存格式的值不一致。


哈哈,是不是看暈了?我也暈,搞不明白為什么文件存儲的格式跟chr(54992)這個函數怎么會扯上關系,而String.fromCharCode(20013)可以得到正確結果(測試的第四部分數據)。大概是Vbs里面邏輯太混亂了。
不管怎樣,有了這個方法,gb2312轉utf-8簡單多了。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 长兴县| 宾川县| 南开区| 晋城| 边坝县| 阿拉尔市| 黔江区| 昌乐县| 惠东县| 沁阳市| 星子县| 隆尧县| 广宗县| 阳西县| 隆林| 蒲城县| 嵊州市| 土默特右旗| 额济纳旗| 招远市| 花垣县| 天台县| 柳州市| 阿合奇县| 杭州市| 新龙县| 南华县| 双鸭山市| 海林市| 延安市| 新乡市| 长治县| 长寿区| 肇源县| 拉萨市| 宜春市| 和林格尔县| 城固县| 全州县| 广德县| 潍坊市|