ES6中字符串的使用方法擴(kuò)展

2019-11-19 11:24:13

字體：大中小

供稿：網(wǎng)友

字符的Unicode表示法

JavaScript允許采用/uxxxx形式表示一個(gè)字符，其中“xxxx”表示字符的碼點(diǎn)。

"/u0061"http:// "a"

但是，這種表示法只限于/u0000――/uFFFF之間的字符。超出這個(gè)范圍的字符，必須用兩個(gè)雙字節(jié)的形式表達(dá)。

"/uD842/uDFB7"http:// "𠮷""/u20BB7"http:// " 7"

上面代碼表示，如果直接在/u后面跟上超過(guò)0xFFFF的數(shù)值（比如/u20BB7），JavaScript會(huì)理解成/u20BB+7。由于/u20BB是一個(gè)不可打印字符，所以只會(huì)顯示一個(gè)空格，后面跟著一個(gè)7。

ES6 對(duì)這一點(diǎn)做出了改進(jìn)，只要將碼點(diǎn)放入大括號(hào)，就能正確解讀該字符。

下面代碼中，最后一個(gè)例子表明，大括號(hào)表示法與四字節(jié)的UTF-16編碼是等價(jià)的。

"/u{20BB7}"http:// "𠮷""/u{41}/u{42}/u{43}"http:// "ABC"let hello = 123;hell/u{6F} // 123'/u{1F680}' === '/uD83D/uDE80'// true

有了上述表示法之后，JavaScript共有6種方法可以表示一個(gè)字符。

'/z' === 'z' // true'/172' === 'z' // true'/x7A' === 'z' // true'/u007A' === 'z' // true'/u{7A}' === 'z' // true

codePointAt()

ES6提供了codePointAt方法，能夠正確處理4個(gè)字節(jié)儲(chǔ)存的字符，返回一個(gè)字符的碼點(diǎn)。

var s = '𠮷a';s.codePointAt(0) // 134071s.codePointAt(1) // 57271s.codePointAt(2) // 97

codePointAt方法的參數(shù)，是字符在字符串中的位置（從0開(kāi)始）。上面代碼中，JavaScript將“𠮷a”視為三個(gè)字符，codePointAt方法在第一個(gè)字符上，正確地識(shí)別了“𠮷”，返回了它的十進(jìn)制碼點(diǎn)134071（即十六進(jìn)制的20BB7）。在第二個(gè)字符（即“𠮷”的后兩個(gè)字節(jié)）和第三個(gè)字符“a”上，codePointAt方法的結(jié)果與charCodeAt方法相同。

codePointAt方法返回的是碼點(diǎn)的十進(jìn)制值，如果想要十六進(jìn)制的值，可以使用toString方法轉(zhuǎn)換一下。

var s = '𠮷a';s.codePointAt(0).toString(16) // "20bb7"s.codePointAt(2).toString(16) // "61"

實(shí)際上codePointAt方法的參數(shù)，仍然是不正確的。上面代碼中，字符a在字符串s的正確位置序號(hào)應(yīng)該是1，但是必須向codePointAt方法傳入2。解決這個(gè)問(wèn)題的一個(gè)辦法是使用for...of循環(huán)，因?yàn)樗鼤?huì)正確識(shí)別32位的UTF-16字符。

var s = '𠮷a';for (let ch of s) { console.log(ch.codePointAt(0).toString(16));}// 20bb7// 61

String.fromCodePoint()

ES5提供String.fromCharCode方法，用于從碼點(diǎn)返回對(duì)應(yīng)字符，但是這個(gè)方法不能識(shí)別32位的UTF-16字符（Unicode編號(hào)大于0xFFFF）。

下面代碼中，String.fromCharCode不能識(shí)別大于0xFFFF的碼點(diǎn)，所以0x20BB7就發(fā)生了溢出，最高位2被舍棄了，最后返回碼點(diǎn)U+0BB7對(duì)應(yīng)的字符，而不是碼點(diǎn)U+20BB7對(duì)應(yīng)的字符。

String.fromCharCode(0x20BB7)// "ஷ"

ES6提供了String.fromCodePoint方法，可以識(shí)別0xFFFF的字符，彌補(bǔ)了String.fromCharCode方法的不足。在作用上，正好與codePointAt方法相反。

String.fromCodePoint(0x20BB7)// "𠮷"String.fromCodePoint(0x78, 0x1f680, 0x79) === 'x/uD83D/uDE80y'// true

上面代碼中，如果String.fromCodePoint方法有多個(gè)參數(shù)，則它們會(huì)被合并成一個(gè)字符串返回。

注意，fromCodePoint方法定義在String對(duì)象上，而codePointAt方法定義在字符串的實(shí)例對(duì)象上。

字符串的遍歷器接口

ES6為字符串添加了遍歷器接口（詳見(jiàn)《Iterator》一章），使得字符串可以被for...of循環(huán)遍歷。

for (let codePoint of 'foo') { console.log(codePoint)}// "f"http:// "o"http:// "o"

at()

目前，ES6有一個(gè)提案，提出字符串實(shí)例的at方法，可以識(shí)別Unicode編號(hào)大于0xFFFF的字符，返回正確的字符。

'abc'.at(0) // "a"'𠮷'.at(0) // "𠮷"

normalize()

許多歐洲語(yǔ)言有語(yǔ)調(diào)符號(hào)和重音符號(hào)。為了表示它們，Unicode提供了兩種方法。一種是直接提供帶重音符號(hào)的字符，比如Ǒ（/u01D1）。另一種是提供合成符號(hào)（combining character），即原字符與重音符號(hào)的合成，兩個(gè)字符合成一個(gè)字符，比如O（/u004F）和ˇ（/u030C）合成Ǒ（/u004F/u030C）。
這兩種表示方法，在視覺(jué)和語(yǔ)義上都等價(jià)，但是JavaScript不能識(shí)別。

'/u01D1'==='/u004F/u030C' //false'/u01D1'.length // 1'/u004F/u030C'.length // 2

上面代碼表示，JavaScript將合成字符視為兩個(gè)字符，導(dǎo)致兩種表示方法不相等。

ES6提供字符串實(shí)例的normalize()方法，用來(lái)將字符的不同表示方法統(tǒng)一為同樣的形式，這稱為Unicode正規(guī)化。

'/u01D1'.normalize() === '/u004F/u030C'.normalize()// true

normalize方法可以接受一個(gè)參數(shù)來(lái)指定normalize的方式，參數(shù)的四個(gè)可選值如下。

NFC，默認(rèn)參數(shù)，表示“標(biāo)準(zhǔn)等價(jià)合成”（Normalization Form Canonical Composition），返回多個(gè)簡(jiǎn)單字符的合成字符。所謂“標(biāo)準(zhǔn)等價(jià)”指的是視覺(jué)和語(yǔ)義上的等價(jià)。
NFD，表示“標(biāo)準(zhǔn)等價(jià)分解”（Normalization Form Canonical Decomposition），即在標(biāo)準(zhǔn)等價(jià)的前提下，返回合成字符分解的多個(gè)簡(jiǎn)單字符。
NFKC，表示“兼容等價(jià)合成”（Normalization Form Compatibility Composition），返回合成字符。所謂“兼容等價(jià)”指的是語(yǔ)義上存在等價(jià)，但視覺(jué)上不等價(jià)，比如“

感谢您访问我们的网站，您可能还对以下资源感兴趣：
国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片

主站蜘蛛池模板：万荣县| 南召县| 柘荣县| 揭阳市| 汾阳市| 张北县| 红安县| 游戏| 崇左市| 福安市| 仁布县| 温泉县| 家居| 永胜县| 常熟市| 红安县| 纳雍县| 轮台县| 忻城县| 兴隆县| 宜城市| 二连浩特市| 军事| 阳山县| 阿拉善左旗| 翁牛特旗| 嵩明县| 紫云| 兴和县| 崇义县| 东兰县| 从江县| 申扎县| 贵港市| 连州市| 昌乐县| 江达县| 井陉县| 偏关县| 呼伦贝尔市| 济宁市|

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

ES6中字符串的使用方法擴(kuò)展