python Django批量導(dǎo)入數(shù)據(jù)

2019-11-25 16:51:48

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

前言：

這期間有研究了Django網(wǎng)頁制作過程中,如何將數(shù)據(jù)批量導(dǎo)入到數(shù)據(jù)庫中.

這個過程真的是慘不忍睹,犯了很多的低級錯誤,這會在正文中說到的.再者導(dǎo)入數(shù)據(jù)用的是py腳本,腳本內(nèi)容參考至自強學(xué)堂--中級教程--數(shù)據(jù)導(dǎo)入.

注：本文主要介紹自己學(xué)習(xí)的經(jīng)驗總結(jié),而非教程!

正文：首先說明采用Django中bulk_create()函數(shù)來實現(xiàn)數(shù)據(jù)批量導(dǎo)入功能,為什么會選擇它呢?

1 bulk_create()是執(zhí)行一條SQL存入多條數(shù)據(jù),使得導(dǎo)入速度更快;

2 bulk_create()減少了SQL語句的數(shù)量;

然后,我們準(zhǔn)備需要導(dǎo)入的數(shù)據(jù)源,數(shù)據(jù)源格式可以是xls,csv,txt等文本文檔;

最后,編寫py腳本,運行即可!

py腳本如下:

#coding:utf-8 import os os.environ.setdefault("DJANGO_SETTINGS_MODULE", "www.settings") '''Django 版本大于等于1.7的時候，需要加上下面兩句import djangodjango.setup()否則會拋出錯誤 django.core.exceptions.AppRegistryNotReady: Models aren't loaded yet.'''import djangoimport datetimeif django.VERSION >= (1, 7):#自動判斷版本  django.setup()from keywork.models import LOrderf = open('cs.csv')WorkList = []next(f) #將文件標(biāo)記移到下一行for line in f:  parts = line.replace('"','') #將字典中的"替換空  parts = parts.split(';') #按;對字符串進行切片  WorkList.append(LOrder(serv_id=parts[0], serv_state_name=parts[1], acct_code=parts[2], acct_name=parts[3], acc_nbr=parts[4], user_name=parts[5],              frod_addr=parts[6], mkt_chnl_name=parts[7],mkt_grid_name=parts[8], com_chnl_name=parts[9],com_grid_name=parts[10],              product_name=parts[11],access_name=parts[12], completed_time=parts[13],remove_data=parts[14], service_offer_name=parts[15],              org_name=parts[16], staff_name=parts[17],staff_code=parts[18], handle_time=parts[19],finish_time=parts[20],              prod_offer_name=parts[21],eff_date=parts[22], exp_date=parts[23],main_flag=parts[24], party_name=parts[25]              )          )f.close() LOrder.objects.bulk_create(WorkList)

根據(jù)上面py腳本源代碼主要來說說自己學(xué)習(xí)過程中遇見的問題

問題1：需要導(dǎo)入的數(shù)據(jù)源中其第一行一般是字段名,從第二行開始才是數(shù)據(jù),所以在腳本利用next(f)將文本標(biāo)記移到第二行進行操作,不然會出現(xiàn)問題,比如字段名一般為英文,默認(rèn)是字符串格式化,腳本執(zhí)行就會遇見ValidationError:YYYY-MM-DD HH:MM[:ss[.uuuuuu]][TZ]這種models數(shù)據(jù)格式與導(dǎo)入數(shù)據(jù)格式不相符合的錯誤!

問題2：注意parts = parts.split(';') #按;對字符串進行切片該語句,因為我們導(dǎo)入數(shù)據(jù)每一行中的每列數(shù)據(jù)之間有間隔符,例如csv中逗號,xls中空格等各種文本默認(rèn)間隔符號,split函數(shù)使用實例如下:

以下實例展示了split()函數(shù)的使用方法：

#!/usr/bin/pythonstr = "Line1-abcdef /nLine2-abc /nLine4-abcd";print str.split( );print str.split(' ', 1 );

以上實例輸出結(jié)果如下：

['Line1-abcdef', 'Line2-abc', 'Line4-abcd']
['Line1-abcdef', '/nLine2-abc /nLine4-abcd']
問題3：如果導(dǎo)入數(shù)據(jù)源超過10M,然后數(shù)據(jù)庫默認(rèn)最大10M,那么上面腳本運行不會成功.以mysql為例,若導(dǎo)入數(shù)據(jù)大小超過數(shù)據(jù)設(shè)置,那么會報2006 go away錯誤,需要在mysql中的my.ini中的[mysqld]下加入下列語句:

max_allowed_packet=300M --最大允許包大小300Mwait_timeout=200000  --連接時間200000sinteractive_timeout = 200000 --斷開時間200000s

以上就是本文的全部內(nèi)容，希望對大家學(xué)習(xí)python批量導(dǎo)入數(shù)據(jù)有所幫助。

上一篇：python Django框架實現(xiàn)自定義表單提交

下一篇：python Django批量導(dǎo)入不重復(fù)數(shù)據(jù)

學(xué)習(xí)交流

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點

榮耀總裁趙明烏鎮(zhèn)演講：榮耀首款5G手機V30下月發(fā)布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關(guān)鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術(shù)創(chuàng)造現(xiàn)實價值

2019-10-21 09:00:12

滴滴英文服務(wù)上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓(xùn)練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術(shù)團隊

2019-09-25 08:15:43

疑難解答

圖片精選

網(wǎng)友關(guān)注

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

python Django批量導(dǎo)入數(shù)據(jù)