Awk是一種非常好的語言,同時有一個非常希奇的名稱。在本系列文章中,DanielRobbins 將使您迅速把握 awk編程技巧。隨著本系列的進展,將討論更高級的主題,最后將演示一個真正的高級awk 演示程序。捍衛 awk 在本系列文章中,我將使您成為精通 awk 的編碼人員。我承認,awk 并沒有一個非常好聽且又非常“時髦”的名字。awk 的 GNU 版本(叫作 gawk)聽起來非常怪異。那些不熟悉這種語言的人可能聽說過 "awk",并可能認為它是一組落伍且過時的混亂代碼。它甚至會使最博學的 UNIX 權威陷于錯亂的邊緣(使他不斷地發出 "kill -9!" 命令,就象使用咖啡機一樣)。 的確,awk 沒有一個動聽的名字。但它是一種很棒的語言。awk 適合于文本處理和報表生成,它還有許多精心設計的特性,答應進行需要非凡技巧程序設計。與某些語言不同,awk 的語法較為常見。它借鑒了某些語言的一些精華部分,如 C 語言、python 和 bash(雖然在技術上,awk 比 python 和 bash 早創建)。awk 是那種一旦學會了就會成為您戰略編碼庫的主要部分的語言。第一個 awk讓我們繼續,開始使用 awk,以了解其工作原理。在命令行中輸入以下命令:
$ awk '{ PRint }' /etc/passwd{ print } 代碼塊。在 awk 中,花括號用于將幾塊代碼組合到一起,這一點類似于 C 語言。在代碼塊中只有一條 print 命令。在 awk 中,假如只出現 print 命令,那么將打印當前行的全部內容。 這里是另一個 awk 示例,它的作用與上例完全相同: $ awk '{ print $0 }' /etc/passwd$0 變量表示整個當前行,所以 print 和 print $0 的作用完全一樣。 假如您愿意,可以創建一個 awk 程序,讓它輸出與輸入數據完全無關的數據。以下是一個示例: $ awk '{ print "" }' /etc/passwd$ awk '{ print "hiya" }' /etc/passwd$ awk -F":" '{ print $1 }' /etc/passwdprint $1 命令時,它會打印出在輸入文件中每一行中出現的第一個字段。以下是另一個示例: $ awk -F":" '{ print $1 $3 }' /etc/passwdhalt7Operator11root0shutdown6sync5bin1....etc.print $1 $3 命令在兩個字段之間插入空格。然而,當兩個字符串在 awk 程序中彼此相鄰時,awk 會連接它們但不在它們之間添加空格。以下命令會在這兩個字段中插入空格: $ awk -F":" '{ print $1 " " $3 }' /etc/passwd$1 、" " 和 $3 ,創建可讀的輸出。當然,假如需要的話,我們還可以插入一些文本標簽: $ awk -F":" '{ print "username: " $1 "/t/tuid:" $3" }' /etc/passwdusername: halt          uid:7username: operator      uid:11username: root          uid:0username: shutdown      uid:6username: sync          uid:5username: bin           uid:1....etc.外部腳本    將腳本作為命令行自變量傳遞給 awk 對于小的單行程序來說是非常簡單的,而對于多行程序,它就比較復雜。您肯定想要在外部文件中撰寫腳本。然后可以向 awk 傳遞 -f 選項,以向它提供此腳本文件: $ awk -f myscript.awk myfile.inBEGIN {    FS=":"}{ print $1 }foo 的那些行: /foo/ { print }/[0-9]+/.[0-9]*/ { print }表達式和塊    還有許多其它方法可以選擇執行代碼塊。我們可以將任意一種布爾表達式放在一個代碼塊之前,以控制何時執行某特定塊。僅當對前面的布爾表達式求值為真時,awk 才執行代碼塊。以下示例腳本輸出將輸出其第一個字段等于 fred 的所有行中的第三個字段。假如當前行的第一個字段不等于 fred ,awk 將繼續處理文件而不對當前行執行 print 語句: $1 == "fred" { print $3 }root ,那么以下示例將只打印這一行中的第三個字段: $5 ~ /root/ { print $3 }   條件語句awk 還提供了非常好的類似于 C 語言的 if 語句。假如您愿意,可以使用 if 語句重寫前一個腳本: {     if ( $5 ~ /root/ ) {         print $3     }}if 語句來選擇執行 print 命令。這兩個方法都可以使用,可以選擇最適合腳本其它部分的一種方法。     以下是更復雜的 awk if 語句示例。可以看到,盡管使用了復雜、嵌套的條件語句, if 語句看上去仍與相應的 C 語言 if 語句一樣: {    if ( $1 == "foo" ) {        if ( $2 == "foo" ) {            print "uno"        } else {            print "one"        }    } else if ($1 == "bar" ) {        print "two"    } else {        print "three"    }}if 語句還可以將代碼: ! /matchme/ { print $1 $3 $4 }{       if ( $0 !~ /matchme/ ) {        print $1 $3 $4    }}matchme 字符序列的那些行。此外,還可以選擇最適合您的代碼的方法。它們的功能完全相同。 awk 還答應使用布爾運算符 ""(邏輯與)和 "&&"(邏輯或),以便創建更復雜的布爾表達式: ( $1 == "foo" ) && ( $2 == "bar" ) { print } foo 且 第二個字段等于 bar 的那些行。 數值變量!    至今,我們不是打印字符串、整行就是特定字段。然而,awk 還答應我們執行整數和浮點運算。通過使用數學表達式,可以很方便地編寫計算文件中空白行數量的腳本。以下就是這樣一個腳本: BEGIN   { x=0 }/^$/    { x=x+1 }END     { print "I found " x " blank lines. :)" }x 初始化成零。然后,awk 每次碰到空白行時,awk 將執行 x=x+1 語句,遞增 x 。處理完所有行之后,執行 END 塊,awk 將打印出最終摘要,指出它找到的空白行數量。                                            QQread.com               推出游戲功略 http://www.qqread.com/netgame/game/index.Html                                魔獸世界               跑跑卡丁車            街頭籃球               水滸Q傳            龍與地下城OL                                征服                軒轅劍5               FIFA07            熱血江湖               大唐風云            夢幻西游               武林外傳                              字符串化變量    awk 的優點之一就是“簡單和字符串化”。我認為 awk 變量“字符串化”是因為所有 awk 變量在內部都是按字符串形式存儲的。同時,awk 變量是“簡單的”,因為可以對它執行數學操作,且只要變量包含有效數字字符串,awk 會自動處理字符串到數字的轉換步驟。要理解我的觀點,請研究以下這個示例: x="1.01"# We just set x to contain the *string* "1.01"x=x+1# We just added one to a *string* print x# Incidentally, these are comments :)2.011.01 賦值給變量 x ,我們仍然可以對它加一。但在 bash 和 python 中卻不能這樣做。首先,bash 不支持浮點運算。而且,假如 bash 有“字符串化”變量,它們并不“簡單”;要執行任何數學操作,bash 要求我們將數字放到丑陋的 $( ) ) 結構中。假如使用 python,則必須在對 1.01 字符串執行任何數學運算之前,將它轉換成浮點值。雖然這并不困難,但它仍是附加的步驟。假如使用 awk,它是全自動的,而那會使我們的代碼又好又整潔。假如想要對每個輸入行的第一個字段乘方并加一,可以使用以下腳本: { print ($1^2)+1 }i++ 、 --foo )、加/減/乘/除賦值運算符( a+=3 、 b*=2 、 c/=2.2 、 d-=6.2 )。不僅如此 -- 我們還有易于使用的模/指數賦值運算符( a^=2 、 b%=4 )。 字段分隔符    awk 有它自己的非凡變量集合。其中一些答應調整 awk 的運行方式,而其它變量可以被讀取以收集關于輸入的有用信息。我們已經接觸過這些非凡變量中的一個,FS。前面已經提到過,這個變量讓您可以設置 awk 要查找的字段之間的字符序列。我們使用 /etc/passwd 作為輸入時,將 FS 設置成 ":"。當這樣做有問題時,我們還可以更靈活地使用 FS。    FS 值并沒有被限制為單一字符;可以通過指定任意長度的字符模式,將它設置成規則表達式。假如正在處理由一個或多個 tab 分隔的字段,您可能希望按以下方式設置 FS: FS="/t+"FS="[[:space:]+]"FS="foo[0-9][0-9][0-9]"字段數量    接著我們要討論的兩個變量通常并不是需要賦值的,而是用來讀取以獲取關于輸入的有用信息。第一個是 NF 變量,也叫做“字段數量”變量。awk 會自動將該變量設置成當前記錄中的字段數量。可以使用 NF 變量來只顯示某些輸入行: NF == 3 { print "this particular record has three fields: " $0 }{       if ( NF > 2 ) {        print $1 " " $2 ":" $3     }}   記錄號    記錄號 (NR) 是另一個方便的變量。它始終包含當前記錄的編號(awk 將第一個記錄算作記錄號 1)。迄今為止,我們已經處理了每一行包含一個記錄的輸入文件。對于這些情況,NR 還會告訴您當前行號。然而,當我們在本系列以后部分中開始處理多行記錄時,就不會再有這種情況,所以要注重!可以象使用 NF 變量一樣使用 NR 來只打印某些輸入行: (NR < 10 )  (NR > 100) { print "We are on record number 1-9 or 101+" }{    #skip header    if ( NR > 10 ) {        print "ok, now for the real information!"    }}新聞熱點
疑難解答