国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 數據庫 > SQL Server > 正文

C#中4秒實現百萬條數據導入SQL SERVER數據庫

2023-05-11 12:02:25
字體:
來源:轉載
供稿:網友

實際工作中有時候需要把大量數據導入數據庫,然后用于各種程序計算,本實驗將使用5中方法完成這個過程,并詳細記錄各種方法所耗費的時間。

本實驗中所用到工具為VS2008和SQL SERVER 2000、SQL SERVER 2008,分別使用5中方法將100萬條數據導入SQL 2000與SQL 2008中,實驗環境是DELL 2850雙2.0GCPU,2G內存的服務器。感興趣的朋友可以下載源代碼自己驗證一下所用時間。

還要有一點需要進行說明,本實驗中執行SQL語句的地方使用了IsLine FrameWork框架中的DataProvider模塊,這個模塊只是對SQL配置的讀取和封裝,并不會對最終結果有本質性的影響,關于IsLine FrameWork框架方面的知識,請參考“IsLine FrameWork”框架系列文章。

下面進入正題,分別使用基本的Insert 語句、使用BULK INSERT語句、在多線程中使用BULK INSERT、使用SqlBulkCopy類、在多線程中使用SqlBulkCopy類五種方法,挑戰4秒極限。

數據庫方面使用SQL 2000與SQL 2008,表名TableB,字段名稱為Value1,數據庫名可以在App.config中修改,默認為test。

導入大量數據的方法 

圖 1 試驗中的5種方法

方法一.使用基本的Insert 語句

這種方法是最基本的方法,大多數人一開始都會想到這種方法。但是Insert語句似乎并不適合大批量的操作,是不是這樣呢?

本方法中將100萬數據分為10個批次,每個批次10萬條,每10萬條1個事務,分10次導入數據庫。

基本語句:Insert Into TableB (Value1) values (‘”+i+”’);

說明:語句中的i是宿主程序中的一個累加變量,用于填充數據庫字段中的值。

SQL 2000 耗時:901599            SQL 2008耗時:497638

方法二.使用BULK INSERT語句

這個類的效果,在本實驗中可以說是最令人滿意的了,它的使用最簡便、靈活,速度很快。

“BULK INSERT”語句似乎不是很常用, Aicken聽說Oracle中有一種可以將外部文件映射為Oracle臨時表,然后直接將臨時表中的數據導入Oracle其他表中的方法,這種方法的速度非常令人滿意,SQL SERVER的BULK INSERT是不是同樣令人滿意呢?

基本語句:BULK INSERT TableB FROM 'c://sql.txt' WITH (FIELDTERMINATOR = ',',ROWTER /.,mbMINATOR='|',BATCHSIZE = 100000)

說明:“c://sql.txt”是一個預先生成的包含100條數據的文件,這些數據以“|”符號分隔,每10萬條數據一個事務。

SQL 2000耗時:4009    SQL 2008耗時:10722

方法三.在多線程中使用BULK INSERT

在方法二的基礎上,將100萬條數據分五個線程,每個線程負責20萬條數據,每5萬條一個事物,五個線程同時啟動,看看這樣的效果吧。

SQL 2000耗時:21099    SQL 2008耗時:10997

方法四.使用SqlBulkCopy類

這種方法速度也很快,但是要依賴內存,對于幾千萬條、多字段的復雜數據,可能在內存方面會有較大的消耗,不過可以使用64位解決方案處理這個問題。

幾千萬條、多字段的數據的情況一般在一些業務場景中會遇到,比如計算全球消費者某個業務周期消費額時,要先獲得主數據庫表中的會員消費記錄快照,并將快照儲存至臨時表中,然后供計算程序使用這些數據。并且有些時候消費者的消費數據并不在一臺數據庫服務器中,而是來自多個國家的多臺服務器,這樣我們就必須借助內存或外存設備中轉這些數據,然后清洗、合并、檢測,最后導入專用表供計算程序使用。

 基本語句:

using (System.Data.SqlClient.SqlBulkCopy sqlBC = new System.Data.SqlClient.SqlBulkCopy(conn))

            {

                sqlBC.BatchSize
= 100000
;

                sqlBC.BulkCopyTimeout
= 60
;

sqlBC.DestinationTableName
= "dbo.TableB"
;

                sqlBC.ColumnMappings.Add(
"valueA", "Value1"
);

                sqlBC.WriteToServer(dt);

            }

說明:

BatchSize = 100000; 指示每10萬條一個事務并提交

BulkCopyTimeout = 60; 指示60秒按超時處理

DestinationTableName = "dbo.TableB"; 指示將數據導入TableB表

ColumnMappings.Add("valueA", "Value1"); 指示將內存中valueA字段與TableB中的Value1字段匹配

WriteToServer(dt);寫入數據庫。其中dt是預先構建好的DataTable,其中包含valueA字段。

SQL 2000耗時:4989       SQL 2008耗時:10412

方法五.在多線程中使用SqlBulkCopy類

基于方法四,將100萬條數據分五個線程,每個線程負責20萬條數據,每5萬條一個事物,五個線程同時啟動,看看這樣的效果吧。

SQL 2000耗時:7682    SQL 2008耗時:10870

總結

 

           數據庫

測試方式

SQL 2000

SQL 2008

基本Insert Into

901599

497638

單線程Bulk Insert

4209

10722

多線程Bulk Insert

21099

10997

單線程SqlBulkCopy

4989

10412

多線程SqlBulkCopy

7682

10870

以上就是這幾天的實驗結果了,比較令人失望的是SQL SERVER 2008導入數據的性能似乎并不想我們想象的那樣優秀。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 任丘市| 丰镇市| 全椒县| 万州区| 双流县| 胶州市| 鄯善县| 庆安县| 旬邑县| 三门县| 武城县| 榕江县| 慈溪市| 怀宁县| 巢湖市| 盐池县| 增城市| 昌吉市| 靖宇县| 无锡市| 务川| 普宁市| 平原县| 合川市| 阿图什市| 莱阳市| 蒲城县| 中卫市| 白银市| 海伦市| 牡丹江市| 汨罗市| 潼南县| 嘉禾县| 乐安县| 桐庐县| 石棉县| 山阴县| 华安县| 克东县| 南城县|