国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 系統(tǒng) > Linux > 正文

在Linux系統(tǒng)中修改文本的字符編碼的方法

2020-05-27 13:00:54
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

   正如我們所知道的那樣,電腦只能夠處理低級(jí)的二進(jìn)制值,并不能直接處理字符。當(dāng)一個(gè)文本文件被存儲(chǔ)時(shí),文件中的每一個(gè)字符都被映射成二進(jìn)制值,實(shí)際存儲(chǔ)在硬盤(pán)中的正是這些“二進(jìn)制值”。之后當(dāng)程序打開(kāi)文本文件時(shí),所有二進(jìn)制值都被讀入并映射回原始的可讀字符。只有當(dāng)所有需要訪問(wèn)這個(gè)文件的程序都能夠“理解”它的編碼,即二進(jìn)制值到字符的映射時(shí),這個(gè)“保存和打開(kāi)”的過(guò)程才能很好地完成,這也確保了可理解數(shù)據(jù)的往返過(guò)程。

  如果不同的程序使用不同的編碼來(lái)處理同一個(gè)文件,源文件中的特殊字符就無(wú)法正常顯示。這里的特殊字符指的是非英文字母的字符,例如帶重音的字符(比如 ?,á,ü)。

  然后問(wèn)題就來(lái)了: 1)我們?nèi)绾未_定一個(gè)確定的文本文件使用的是什么字符編碼? 2)我們?nèi)绾伟盐募D(zhuǎn)換成已選擇的字符編碼?

  步驟一

  為了確定文件的字符編碼,我們使用一個(gè)名為 “file” 的命令行工具。因?yàn)?file 命令是一個(gè)標(biāo)準(zhǔn)的 UNIX 程序,所以我們可以在所有現(xiàn)代的 Linux 發(fā)行版中找到它。

  運(yùn)行下面的命令:

  代碼如下:

  $ file --mime-encoding filename

2015617180329059.jpg (378×122)

  步驟二

  下一步是查看你的 Linux 系統(tǒng)所支持的文件編碼種類。為此,我們使用名為 iconv 的工具及 “-l” 選項(xiàng)(L 的小寫(xiě))來(lái)列出所有當(dāng)前支持的編碼。

  代碼如下:

  $ iconv -l

  iconv 工具是 GNU libc 庫(kù)組成部分,因此它在所有 Linux 發(fā)行版中都是開(kāi)箱即用的。

  步驟三

  在我們?cè)谖覀兊?Linux 系統(tǒng)所支持的編碼里面選定了目標(biāo)編碼之后,運(yùn)行下面的命令來(lái)完成編碼轉(zhuǎn)換:

  代碼如下:

  $ iconv -f old_encoding -t new_encoding filename

  例如,把 iso-8859-1 編碼轉(zhuǎn)換為 utf-8 編碼:

  代碼如下:

  $ iconv -f iso-8859-1 -t utf-8 input.txt

2015617180351168.png (451×129)

  了解了我們演示的如何使用這些工具之后,你可以像下面這樣修復(fù)一個(gè)受損的字幕文件:

2015617180409006.jpg (640×302)
發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 广德县| 滕州市| 万年县| 乐都县| 海丰县| 富源县| 庆城县| 丘北县| 宜宾市| 大足县| 东至县| 遵义县| 凤台县| 榆中县| 胶州市| 忻城县| 壶关县| 龙川县| 汉阴县| 灵宝市| 丰原市| 成安县| 繁昌县| 奈曼旗| 永新县| 乐陵市| 屯昌县| 中宁县| 班戈县| 曲水县| 陕西省| 许昌市| 嵊泗县| 白银市| 白山市| 阿图什市| 湖南省| 板桥市| 伊金霍洛旗| 土默特左旗| 万荣县|