国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 系統 > Linux > 正文

在Linux系統中修改文本的字符編碼的方法

2020-07-10 11:23:36
字體:
來源:轉載
供稿:網友

正如我們所知道的那樣,電腦只能夠處理低級的二進制值,并不能直接處理字符。當一個文本文件被存儲時,文件中的每一個字符都被映射成二進制值,實際存儲在硬盤中的正是這些“二進制值”。之后當程序打開文本文件時,所有二進制值都被讀入并映射回原始的可讀字符。只有當所有需要訪問這個文件的程序都能夠“理解”它的編碼,即二進制值到字符的映射時,這個“保存和打開”的過程才能很好地完成,這也確保了可理解數據的往返過程。

如果不同的程序使用不同的編碼來處理同一個文件,源文件中的特殊字符就無法正常顯示。這里的特殊字符指的是非英文字母的字符,例如帶重音的字符(比如 ?,á,ü)。

然后問題就來了: 1)我們如何確定一個確定的文本文件使用的是什么字符編碼? 2)我們如何把文件轉換成已選擇的字符編碼?
步驟一

為了確定文件的字符編碼,我們使用一個名為 “file” 的命令行工具。因為 file 命令是一個標準的 UNIX 程序,所以我們可以在所有現代的 Linux 發行版中找到它。

運行下面的命令:

   

復制代碼
代碼如下:
$ file --mime-encoding filename

    2015617180329059.jpg (378×122)

步驟二

下一步是查看你的 Linux 系統所支持的文件編碼種類。為此,我們使用名為 iconv 的工具及 “-l” 選項(L 的小寫)來列出所有當前支持的編碼。

   

復制代碼
代碼如下:
$ iconv -l

iconv 工具是 GNU libc 庫組成部分,因此它在所有 Linux 發行版中都是開箱即用的。
步驟三

在我們在我們的 Linux 系統所支持的編碼里面選定了目標編碼之后,運行下面的命令來完成編碼轉換:

   

復制代碼
代碼如下:
$ iconv -f old_encoding -t new_encoding filename

例如,把 iso-8859-1 編碼轉換為 utf-8 編碼:

   

復制代碼
代碼如下:
$ iconv -f iso-8859-1 -t utf-8 input.txt

    2015617180351168.png (451×129)

    了解了我們演示的如何使用這些工具之后,你可以像下面這樣修復一個受損的字幕文件:
    2015617180409006.jpg (640×302)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 巫溪县| 和顺县| 平凉市| 尉犁县| 八宿县| 桃园县| 葫芦岛市| 饶阳县| 青海省| 天气| 浮梁县| 久治县| 平安县| 潞西市| 南澳县| 界首市| 当阳市| 肇州县| 峨眉山市| 华安县| 柳江县| 台安县| 安仁县| 财经| 乌兰察布市| 游戏| 长治县| 东台市| 崇左市| 红河县| 安多县| 杭锦旗| 仁寿县| 通渭县| 洛南县| 瑞安市| 枣强县| 张北县| 克山县| 民乐县| 平安县|