国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 系統 > Linux > 正文

Shell腳本學習指南之文本處理工具

2019-10-26 18:36:04
字體:
來源:轉載
供稿:網友

4.1 排序文本

4.1.1 行的排序
未提供命令行選項時,整個記錄會根據當前locale所定義的次序排序。
在傳統的C locale中,也就是ASCII順序。

4.1.2 以字段排序
-k選項的后面接著的是一個字段編號,或者是一對數字。
每個編號后面都可以接一個點號的字符位置,或修飾符字母。

如果僅指定一個字段編號,則排序鍵值會自該字段的起始處開始,
一直繼續到記錄的結尾(而非字段的結尾)。

如果給的是一對用逗號隔開的字段數字,則排序鍵值將由第一個字段值的起始處開始,
結束于第二個字段值的結尾。使用點號表示字符位置。
-k2.4, 5.6指的是從第二個字段的第四個字符開始比較,一直比到第五個字段的第六個字符。
$ sort -t: -k1,1 /etc/passwd     以用戶名稱排序
bin:x:1:1:bin:/bin:/sbin/nologin
chico:x:12501:1000:Chico Marx:/home/chico:/bin/bash
harpo:x:12502:1000:Harpo Marx:/home/harpo:/bin/ksh
...

$ sort -t: -k3,3nr /etc/passwd     反省UID排序
或-k3nr,3或-k3,3 -n -r都可以。

4.1.3 文本塊的排序
有時需要對多行記錄組合而成的數據排序。以地址清單為例:
$ cat my-friends
# SORTKEY: Schlo, Hans Jurgen
Hans Jurgen Schlo
Unter den Linden 78
D-10117 Berlin
Germany

# SORTKEY: Jones, Adrian
...

技巧是:利用awk識別段落間隔,在每個地址內暫時使用一個未用過的字符取代分行。
sort看到的行就會變成這樣:
# SORTKEY: Schlo, Hans Jurgen^ZHans Jurgen Schlo^ZUnter den Linden 78^Z...
cat my-friends |               讀取地址文件
     awk -v RS=" " '{ gsub("/n", "^Z"); print }' |    轉換地址為單行
          sort -f |           排序地址數據,忽略大小寫
               awk -v ORS="/n/n" '{ gsub("^Z", "/n"); print }' |  恢復行結構
                    grep -v '# SORTKEY'   刪除標記行
1. 函數gsub()為全局性替換(global substitution),類似sed下的s/x/y/g結構。
2. RS變量時輸入數據的記錄分隔器(Record Separator)。
   通常輸入數據以換行隔開,使每行成為單個記錄。
    RS=" "是一個特殊用法,指的是記錄以空行隔開。
3. ORS是輸出記錄分隔器。
注:'{ action }'是對每個字段的操作,而RS,ORS都是對記錄的設定。

4.1.5 sort的穩定性
sort并不穩定。

4.2 刪除重復
sort -u是依據匹配的鍵值進行消除操作,而非匹配的記錄。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 伊通| 鹤峰县| 闽侯县| 光山县| 九寨沟县| 洛隆县| 琼海市| 扬中市| 象州县| 沛县| 夏邑县| 稻城县| 仁寿县| 新密市| 庆云县| 将乐县| 盈江县| 乌兰浩特市| 曲阜市| 马鞍山市| 江津市| 称多县| 沂南县| 南宫市| 浮山县| 始兴县| 华池县| 祁阳县| 武强县| 巴马| 张家港市| 惠水县| 宁强县| 稷山县| 武威市| 双辽市| 永和县| 唐海县| 陵水| 朝阳区| 周至县|