国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Perl中著名的Schwartzian轉(zhuǎn)換問題解決實現(xiàn)

2019-11-25 17:19:56
字體:
供稿:網(wǎng)友

Perl中著名的Schwartzian轉(zhuǎn)換,其產(chǎn)生背景主要涉及到排序問題:
比如說,根據(jù)文件名以字母順序排序,代碼如下:

復(fù)制代碼 代碼如下:

use strict; 
use warnings; 
  
my @files = glob "*.xml";          #perl中文件操作符glob提供相當于shell中的通配符的功能 
my @sorted_files = sort @files;    #sort(),排序,默認是字母順序排序

比如說,根據(jù)文件名長度排序,其代碼如下:
復(fù)制代碼 代碼如下:

use strict; 
use warnings; 
 
#length求長度。 太空船操作符<=>,默認變量是$a,$b,返回值為-1,0,1分別表示大于,==,小于。 sort進行排序 
my $files = ".xml"; 
my @sorted_length = sort { length($a) <=> length($b) } @files; 

上面的兩種情況,對很多文件操作來說,速度還不算慢,如果是下面這種情況。
比如說:要批量比較文件大小,其代碼如下:
復(fù)制代碼 代碼如下:

use strict; 
use warnings; 
  
my @files     = glob "*.xml";    
my @sort_size = sort { -s $a <=> -s $b } @files;  #比較大小 

上面的代碼設(shè)計到三重(次)操作:
1. 從硬盤上獲取文件大小(-s $b)
2. 比較文件大小(太空船操作)
3. 對其進行排序(sort操作)
考慮到要比較$a,$b大小時,要從硬盤中獲取兩次,所以次數(shù)是6次!也就是說,如果有1萬個文件,總共是6萬次。
其算法復(fù)雜度是: n*long(n),考慮到后兩項(比較文件大小,進行排序)必然要進行的操作,但第一項卻可以降低!
即一次性從硬盤中讀取所有文件大小,將其放置到Perl中的默認的變量,并存儲到內(nèi)存中!于是又下面算法實現(xiàn):
復(fù)制代碼 代碼如下:

use strict; 
use warnings; 
 
my @files = glob "*.xml"; 
 
my @unsorted_pairs = map  { [$_, -s $_] } @files; 
my @sorted_pairs   = sort { $a->[1] <=> $b->[1] } @unsorted_pairs; 
my @sorted_files   = map  { $_->[0] } @sorted_pairs; 

看上去比較復(fù)雜,分三個步驟解釋下:
第一步:遍歷文件列表,對每個文件創(chuàng)建一個數(shù)組引用。數(shù)組引用包含兩個元素:
       第一個是文件名($_),第二個是文件大小(-s $_)。這樣,處理每個文件只訪問一次磁盤。
第二步:對二維數(shù)組排序。因比較文件大小,所以需取元素[1],比較它們的值。得到另一個二維數(shù)組。
第三步:丟掉文件大小元素,創(chuàng)建一個只含文件名的列表。完成目標!
上面的代碼使用了兩個臨時數(shù)組,但這并不是必須的。我們可以一個語句就能完成所有的工作。為了達到目的,需要按照“數(shù)據(jù)從右流向左”的原理反轉(zhuǎn)句子順序,不如果將每個句子放在單獨一行,并且留出足夠的空間,我們依然可以寫出可讀性高的代碼。
復(fù)制代碼 代碼如下:

my @quickly_sorted_files = 
    map  { $_->[0] } 
    sort { $a->[1] <=> $b->[1] } 
    map  { [$_, -s $_] } 
    @files; 

這就是以Randal L. Schwartz命名的Schwartzian轉(zhuǎn)換,對數(shù)據(jù)量特多的情況下,其速度要比前者快數(shù)倍!
下面寫了小程序,包括在生成1萬個xml文件,在兩種情況下,完整代碼如下:
復(fù)制代碼 代碼如下:

#!/usr/bin/perl -w 
use strict; 
use warnings; 
use autodie; 
use v5.10; 
 
###################################### 
###  創(chuàng)建要比較的10,000個.xml文件 ### 
###################################### 
my $profix = ".xml"; 
 
foreach my $num (1..10000) { 
    open(my $fh, '>', $num . $profix) || die "Can not create the file: $!/n"; 
    print $fh "This is file size testing!"; 

 
print "All the 10_1000 files created! /n"; 
 
 
###################################### 
### 常規(guī)轉(zhuǎn)換:      遍歷20次       ### 
###################################### 
my $t1  = time(); 
 
foreach (1..20){  
    my @files     = glob "*.xml"; 
    my @sorted    = sort { -s $a <=> -s $b } @files; 

 
say "常規(guī)算法需要時間: => ", time()- $t1; 
 
 
###################################### 
### Schwartzian轉(zhuǎn)換: 遍歷20次     ### 
###################################### 
my $t2  = time(); 
 
foreach (1..20){  
    my @files = glob "*.xml"; 
        my @sorted =  
            map  {$_->[0]} 
            sort {$a->[1] <=> $b->[1]} 
            map  {[$_, -s $_]} 
       @files; 

say "Schwartzian算法需要時間: => ", time()- $t2; 

輸出結(jié)果:
All the 10_1000 files created!
常規(guī)算法需要時間:          => 185
Schwartzian算法需要時間: => 115

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 武穴市| 砚山县| 芷江| 连山| 汾阳市| 华阴市| 桂东县| 志丹县| 务川| 左权县| 江西省| 大关县| 金昌市| 玉溪市| 罗定市| 文成县| 同江市| 东乡族自治县| 浦城县| 进贤县| 托里县| 鄂托克前旗| 普兰店市| 那坡县| 桂平市| 潜山县| 田阳县| 广东省| 东丰县| 健康| 肇州县| 扶余县| 同仁县| 十堰市| 昌邑市| 文山县| 上饶市| 关岭| 巴马| 芮城县| 临夏市|