国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > .NET > 正文

asp.net下大文件上傳知識整理

2024-07-10 13:14:26
字體:
供稿:網(wǎng)友
最近做在做ePartner項目,涉及到文件上傳的問題。 以前也做過文件上傳,但都是些小文件,不超過2M。 這次要求上傳100M以上的東西。 沒辦法找來資料研究了一下?;赪EB的文件上傳可以使用FTP和HTTP兩種協(xié)議,用FTP的話雖然傳輸穩(wěn)定,但安全性是個嚴(yán)重的問題,而且FTP服務(wù)器讀用戶庫獲取權(quán)限,這樣對于用戶使用來說還是不太方便。 剩下只有HTTP。在HTTP中有3種方式,PUT、WEBDAV、RFC1867,前2種方法不適合大文件上傳,目前我們使用的web上傳都是基于RFC1867標(biāo)準(zhǔn)的HTML中基于表單的文件上傳。 
一、先簡要介紹一下RFC1867(Form-based File Upload in HTML)標(biāo)準(zhǔn): 
1.帶有文件提交功能的HTML表單 
現(xiàn)有的HTML規(guī)范為INPUT元素的TYPE屬性定義了八種可能的值,分別是:CHECKBOX, HIDDEN, IMAGE, PASSWORD, RADIO, RESET, SUBMIT, TEXT. 另外,當(dāng)表單采用POST方式的時候,表單默認(rèn)的具有"application/x-www -form-urlencoded" 的ENCTYPE屬性。 
RFC1867標(biāo)準(zhǔn)對HTML做出了兩處修改: 
1)為INPUT元素的TYPE屬性增加了一個FILE選項。 
2)INPUT標(biāo)記可以具有ACCEPT屬性,該屬性能夠指定可被上傳的文件類型或文件格式列表。 
另外,本標(biāo)準(zhǔn)還定義了一種新的MIME類型:multipart/form-data,以及當(dāng)處理一個帶有ENCTYPE="multipart/form-data" 并且/或含有<INPUT type="file">的標(biāo)記的表單時所應(yīng)該采取的行為。 
舉例來說,當(dāng)HTML表單作者想讓用戶能夠上傳一個或更多的文件時,他可以這么寫: 
<FORM ENCTYPE="multipart/form-data" ACTION="_URL_" METHOD=POST> 
File to process: 
<INPUT NAME="userfile1" TYPE="file"> 
<INPUT TYPE="submit" VALUE="Send File"> 
</FORM> 
HTML DTD里所需要做出的改動是為InputType實體增加一個選項。此外,我們也建議用一系列用逗號分隔的文件類型來作為INPUT標(biāo)記的ACCEPT屬性。 
... (其他元素) ... 
<!ENTITY % InputType "(TEXT | PASSWORD | CHECKBOX | 
RADIO | SUBMIT | RESET | 
IMAGE | HIDDEN | FILE )"> 
<!ELEMENT INPUT - 0 EMPTY> 
<!ATTLIST INPUT 
TYPE %InputType TEXT 
NAME CDATA #IMPLIED -- required for all but submit and reset 
VALUE CDATA #IMPLIED 
SRC %URI #IMPLIED -- for image inputs -- 
CHECKED (CHECKED) #IMPLIED 
SIZE CDATA #IMPLIED --like NUMBERS, 
but delimited with comma, not space 
MAXLENGTH NUMBER #IMPLIED 
ALIGN (top|middle|bottom) #IMPLIED 
ACCEPT CDATA #IMPLIED --list of content types 

... (其他元素) ... 
2.文件傳輸延遲 
在某些情況下,在確實準(zhǔn)備接受數(shù)據(jù)前,服務(wù)器先對表單數(shù)據(jù)中的某些元素(比如說用戶名,賬號等)進(jìn)行驗證是推薦的做法。但是,經(jīng)過一定的考慮后,我們認(rèn)為如果服務(wù)器想這樣做的話,最好是采用一系列的表單,并將前面所驗證過的數(shù)據(jù)元素作為“隱藏”字段傳回給客戶端,或者是通過安排表單使那些需要驗證的元素先顯示出來。這樣的話,那些需要做復(fù)雜的應(yīng)用的服務(wù)器可以自己維持事務(wù)處理的狀態(tài),而那些簡單的應(yīng)用的則可以實現(xiàn)得簡單些。 
HTTP 協(xié)議可能需要知道整個事務(wù)處理中的內(nèi)容總長度。即使沒有明確要求,HTTP客戶端也應(yīng)該提供上傳的所有文件的內(nèi)容總長度,這樣一個繁忙的服務(wù)器就能夠判斷文件的內(nèi)容是否是過大以至于將不能完整地處理,從而返回一個錯誤代碼并關(guān)閉該連接,而不用等到接受了所有的數(shù)據(jù)才進(jìn)行判斷。目前一些現(xiàn)有的CGI應(yīng)用對所有的POST事務(wù)都需要知道內(nèi)容總長度。 
如果INPUT標(biāo)記含有一個MAXLENGTH屬性,客戶端可以將這個屬性值看作是服務(wù)器端所能夠接受的傳送文件的最大字節(jié)數(shù)。在這種情況下,服務(wù)器能夠在上傳開始前,提示客戶端在服務(wù)器上有多少空間可以用來進(jìn)行文件上傳。但是應(yīng)該引起注意的是,這僅僅是一個提示,在表單被創(chuàng)建后和文件上傳前,服務(wù)器的實際需求可能會發(fā)生改變。 
在任何情況下,如果接受的文件過大的話,任何一個HTTP服務(wù)器都有可能在文件傳輸?shù)倪^程中中斷傳輸。 
3.傳輸二進(jìn)制數(shù)據(jù)的其他解決辦法 
有些人曾經(jīng)建議使用一種新的MIME類型"aggregate",比如說aggregate/mixed 或是content-transfer- encoding "包"來描述那些不確定長度的二進(jìn)制數(shù)據(jù),而不是靠分解為多個部分來表示。雖然我們并不反對這么做,但這需要增加額外的設(shè)計和標(biāo)準(zhǔn)化工作來讓大家接受并理解"aggregate"。 從另一方面來說,"分解為多部分"的機(jī)制工作得很好,能夠非常簡單的在客戶發(fā)送端和服務(wù)器接受端加以實現(xiàn),而且能像其他一些綜合處理二進(jìn)制數(shù)據(jù)的方式一樣高效率地工作。 
4.例子 
假設(shè)服務(wù)器段提供的是如下的HTML: 
<FORM ACTION="http://server.dom/cgi/handle" 
ENCTYPE="multipart/form-data" 
METHOD=POST> 
What is your name? <INPUT TYPE=TEXT NAME=submitter> 
What files are you sending? <INPUT TYPE=FILE NAME=pics> 
</FORM> 
用戶在“姓名”字段里面填寫"Joe Blow",對問題'What files are you sending?',用戶選擇 
了一個文本文件"file1.txt"。 
客戶段可能發(fā)送回如下的數(shù)據(jù): 
Content-type: multipart/form-data, boundary=AaB03x 
--AaB03x 
content-disposition: form-data; name="field1" 
Joe Blow 
--AaB03x 
content-disposition: form-data; name="pics"; filename="file1.txt" 
Content-Type: text/plain 
... file1.txt 的內(nèi)容... 
--AaB03x-- 
如果用戶同時還選擇了另一個圖片文件"file2.gif",那么客戶端可能發(fā)送的數(shù)據(jù)將是: 
Content-type: multipart/form-data, boundary=AaB03x 
--AaB03x 
content-disposition: form-data; name="field1" 
Joe Blow 
--AaB03x 
content-disposition: form-data; name="pics" 
Content-type: multipart/mixed, boundary=BbC04y 
--BbC04y 
Content-disposition: attachment; filename="file1.txt" 
Content-Type: text/plain 
... file1.txt 的內(nèi)容... 
--BbC04y 
Content-disposition: attachment; filename="file2.gif" 
Content-type: image/gif 
Content-Transfer-Encoding: binary 
... file2.gif的內(nèi)容... 
--BbC04y-- 
--AaB03x-- 
二、利用RFC1867標(biāo)準(zhǔn)處理文件上傳的兩種方式: 
1.一次性得到上傳的數(shù)據(jù),然后分析處理。 
看了N多代碼之后發(fā)現(xiàn),目前無組件程序和一些COM組件都是使用Request.BinaryRead方法。一次性得到上傳的數(shù)據(jù),然后分析處理。這就是為什么上傳大文件很慢的原因了,IIS超時不說,就算幾百M(fèi)文件上去了,分析處理也得一陣子。 
2.一邊接收文件,一邊寫硬盤。 
了解了一下國外的商業(yè)組件,比較流行的有Power-Web,AspUpload,ActiveFile,ABCUpload, aspSmartUpload,SA-FileUp。其中比較優(yōu)秀的是ASPUPLOAD和SA-FILE,他們號稱可以處理2G的文件(SA- FILE EE版甚至沒有文件大小的限制),而且效率也是非常棒,難道編程語言的效率差這么多?查了一些資料,覺得他們都是直接操作文件流。這樣就不受文件大小的制約。但老外的東西也不是絕對完美,ASPUPLOAD處理大文件后,內(nèi)存占用情況驚人。1G左右都是稀松平常。至于SA-FILE雖然是好東西但是破解難尋。然后發(fā)現(xiàn)2款.NET上傳組件,Lion.Web.UpLoadModule和AspnetUpload也是操作文件流。但是上傳速度和 CPU占用率都不如老外的商業(yè)組件。 
做了個測試,LAN內(nèi)傳1G的文件。ASPUPLOAD上傳速度平均是4.4M/s,CPU占用10 -15,內(nèi)存占用700M。SA-FILE也差不多這樣。而AspnetUpload最快也只有1.5M/s,平均是700K/s,CPU占用15- 39,測試環(huán)境: PIII800,256M內(nèi)存,100M LAN。我想AspnetUpload速度慢是可能因為一邊接收文件,一邊寫硬盤。資源占用低的代價就是降低傳輸速度。但也不得不佩服老外的程序,CPU占用如此之低..... 
三、ASP.NET上傳文件遇到的問題 
我們在用ASP.NET上傳大文件時都遇到過這樣或那樣的問題。設(shè)置很大的maxRequestLength值并不能完全解決問題,因為ASP.NET會 block直到把整個文件載入內(nèi)存后,再加以處理。實際上,如果文件很大的話,我們經(jīng)常會見到Internet Explorer顯示 "The page cannot be displayed - Cannot find server or DNS Error",好像是怎么也 catch不了這個錯誤。為什么?因為這是個client side錯誤,server side端的Application_Error是處理不到的。 
四、ASP.NET大文件上傳解決方案 
解決的方法是利用隱含的HttpWorkerRequest,用它的GetPreloadedEntityBody 和 ReadEntityBody方法從IIS為ASP.NET建立的pipe里分塊讀取數(shù)據(jù)。Chris Hynes為我們提供了這樣的一個方案(用HttpModule),該方案除了允許你上傳大文件外,還能實時顯示上傳進(jìn)度。 
Lion.Web.UpLoadModule和AspnetUpload 兩個.NET組件都是利用的這個方案。 
方案原理: 
利用HttpHandler實現(xiàn)了類似于ISAPI Extention的功能,處理請求(Request)的信息和發(fā)送響應(yīng)(Response)。 
方案要點(diǎn): 
1. httpHandler or HttpModule 
a.在asp.net進(jìn)程處理request請求之前截獲request對象 
b.分塊讀取和寫入數(shù)據(jù) 
c.實時跟蹤上傳進(jìn)度更新meta信息 
2. 利用隱含的HttpWorkerRequest用它的GetPreloadedEntityBody 和 ReadEntityBody方法處理文件流 
IServiceProvider provider = (IServiceProvider) HttpContext.Current; 
HttpWorkerRequest wr = (HttpWorkerRequest) provider.GetService(typeof(HttpWorkerRequest)); 
byte[] bs = wr.GetPreloadedEntityBody(); 
.... 
if (!wr.IsEntireEntityBodyIsPreloaded()) 

int n = 1024; 
byte[] bs2 = new byte[n]; 
while (wr.ReadEntityBody(bs2,n) >0) 

..... 


3. 自定義Multipart MIME 解析器 
自動截獲MIME分割符 
將文件分塊寫如臨時文件 
實時更新Appliaction 狀態(tài)(ReceivingData, Error, Complete)
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 灵宝市| 徐水县| 诸城市| 射阳县| 扶绥县| 蓬溪县| 开远市| 文山县| 丽江市| 闽清县| 托克逊县| 奈曼旗| 武隆县| 原平市| 从化市| 宣武区| 乌兰浩特市| 临沧市| 水城县| 双柏县| 威远县| 莱芜市| 京山县| 建瓯市| 南通市| 富裕县| 曲沃县| 陇南市| 安化县| 赤峰市| 苍山县| 北流市| 阜新市| 长垣县| 长治市| 乌兰察布市| 桂东县| 松阳县| 天津市| 民县| 观塘区|