国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

用實例詳解Python中的Django框架中prefetch_related()函數對數據庫查詢的優化

2019-11-25 17:52:25
字體:
來源:轉載
供稿:網友

實例的背景說明

假定一個個人信息系統,需要記錄系統中各個人的故鄉、居住地、以及到過的城市。數據庫設計如下:

201541150650059.jpg (591×250)

Models.py 內容如下:
 

from django.db import models class Province(models.Model): name = models.CharField(max_length=10) def __unicode__(self):  return self.name class City(models.Model): name = models.CharField(max_length=5) province = models.ForeignKey(Province) def __unicode__(self):  return self.name class Person(models.Model): firstname = models.CharField(max_length=10) lastname = models.CharField(max_length=10) visitation = models.ManyToManyField(City, related_name = "visitor") hometown = models.ForeignKey(City, related_name = "birth") living  = models.ForeignKey(City, related_name = "citizen") def __unicode__(self):  return self.firstname + self.lastname

注1:創建的app名為“QSOptimize”

注2:為了簡化起見,`qsoptimize_province` 表中只有2條數據:湖北省和廣東省,`qsoptimize_city`表中只有三條數據:武漢市、十堰市和廣州市

prefetch_related()

對于多對多字段(ManyToManyField)和一對多字段,可以使用prefetch_related()來進行優化。或許你會說,沒有一個叫OneToManyField的東西啊。實際上 ,ForeignKey就是一個多對一的字段,而被ForeignKey關聯的字段就是一對多字段了。

 
作用和方法

prefetch_related()和select_related()的設計目的很相似,都是為了減少SQL查詢的數量,但是實現的方式不一樣。后者是通過JOIN語句,在SQL查詢內解決問題。但是對于多對多關系,使用SQL語句解決就顯得有些不太明智,因為JOIN得到的表將會很長,會導致SQL語句運行時間的增加和內存占用的增加。若有n個對象,每個對象的多對多字段對應Mi條,就會生成Σ(n)Mi 行的結果表。

prefetch_related()的解決方法是,分別查詢每個表,然后用Python處理他們之間的關系。繼續以上邊的例子進行說明,如果我們要獲得張三所有去過的城市,使用prefetch_related()應該是這么做:
 

>>> zhangs = Person.objects.prefetch_related('visitation').get(firstname=u"張",lastname=u"三")>>> for city in zhangs.visitation.all() :...  print city...

上述代碼觸發的SQL查詢如下:
 

SELECT `QSOptimize_person`.`id`, `QSOptimize_person`.`firstname`,`QSOptimize_person`.`lastname`, `QSOptimize_person`.`hometown_id`, `QSOptimize_person`.`living_id`FROM `QSOptimize_person`WHERE (`QSOptimize_person`.`lastname` = '三' AND `QSOptimize_person`.`firstname` = '張'); SELECT (`QSOptimize_person_visitation`.`person_id`) AS `_prefetch_related_val`, `QSOptimize_city`.`id`,`QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE `QSOptimize_person_visitation`.`person_id` IN (1);

第一條SQL查詢僅僅是獲取張三的Person對象,第二條比較關鍵,它選取關系表`QSOptimize_person_visitation`中`person_id`為張三的行,然后和`city`表內聯(INNER JOIN 也叫等值連接)得到結果表。
 

+----+-----------+----------+-------------+-----------+| id | firstname | lastname | hometown_id | living_id |+----+-----------+----------+-------------+-----------+| 1 | 張    | 三    |      3 |     1 |+----+-----------+----------+-------------+-----------+1 row in set (0.00 sec) +-----------------------+----+-----------+-------------+| _prefetch_related_val | id | name   | province_id |+-----------------------+----+-----------+-------------+|           1 | 1 | 武漢市  |      1 ||           1 | 2 | 廣州市  |      2 ||           1 | 3 | 十堰市  |      1 |+-----------------------+----+-----------+-------------+3 rows in set (0.00 sec)

顯然張三武漢、廣州、十堰都去過。

又或者,我們要獲得湖北的所有城市名,可以這樣:
 

>>> hb = Province.objects.prefetch_related('city_set').get(name__iexact=u"湖北省")>>> for city in hb.city_set.all():...  city.name...

觸發的SQL查詢:
 

SELECT `QSOptimize_province`.`id`, `QSOptimize_province`.`name`FROM `QSOptimize_province`WHERE `QSOptimize_province`.`name` LIKE '湖北省' ; SELECT `QSOptimize_city`.`id`, `QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`WHERE `QSOptimize_city`.`province_id` IN (1);

得到的表:
 

+----+-----------+| id | name   |+----+-----------+| 1 | 湖北省  |+----+-----------+1 row in set (0.00 sec) +----+-----------+-------------+| id | name   | province_id |+----+-----------+-------------+| 1 | 武漢市  |      1 || 3 | 十堰市  |      1 |+----+-----------+-------------+2 rows in set (0.00 sec)

我們可以看見,prefetch使用的是 IN 語句實現的。這樣,在QuerySet中的對象數量過多的時候,根據數據庫特性的不同有可能造成性能問題。

 
使用方法
*lookups 參數

prefetch_related()在Django < 1.7 只有這一種用法。和select_related()一樣,prefetch_related()也支持深度查詢,例如要獲得所有姓張的人去過的省:
 

>>> zhangs = Person.objects.prefetch_related('visitation__province').filter(firstname__iexact=u'張')>>> for i in zhangs:...  for city in i.visitation.all():...   print city.province...

觸發的SQL:
 

SELECT `QSOptimize_person`.`id`, `QSOptimize_person`.`firstname`,`QSOptimize_person`.`lastname`, `QSOptimize_person`.`hometown_id`, `QSOptimize_person`.`living_id`FROM `QSOptimize_person`WHERE `QSOptimize_person`.`firstname` LIKE '張' ; SELECT (`QSOptimize_person_visitation`.`person_id`) AS `_prefetch_related_val`, `QSOptimize_city`.`id`,`QSOptimize_city`.`name`, `QSOptimize_city`.`province_id` FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE `QSOptimize_person_visitation`.`person_id` IN (1, 4); SELECT `QSOptimize_province`.`id`, `QSOptimize_province`.`name`FROM `QSOptimize_province`WHERE `QSOptimize_province`.`id` IN (1, 2);

獲得的結果:
 

+----+-----------+----------+-------------+-----------+| id | firstname | lastname | hometown_id | living_id |+----+-----------+----------+-------------+-----------+| 1 | 張    | 三    |      3 |     1 || 4 | 張    | 六    |      2 |     2 |+----+-----------+----------+-------------+-----------+2 rows in set (0.00 sec) +-----------------------+----+-----------+-------------+| _prefetch_related_val | id | name   | province_id |+-----------------------+----+-----------+-------------+|           1 | 1 | 武漢市  |      1 ||           1 | 2 | 廣州市  |      2 ||           4 | 2 | 廣州市  |      2 ||           1 | 3 | 十堰市  |      1 |+-----------------------+----+-----------+-------------+4 rows in set (0.00 sec) +----+-----------+| id | name   |+----+-----------+| 1 | 湖北省  || 2 | 廣東省  |+----+-----------+2 rows in set (0.00 sec)

值得一提的是,鏈式prefetch_related會將這些查詢添加起來,就像1.7中的select_related那樣。

要注意的是,在使用QuerySet的時候,一旦在鏈式操作中改變了數據庫請求,之前用prefetch_related緩存的數據將會被忽略掉。這會導致Django重新請求數據庫來獲得相應的數據,從而造成性能問題。這里提到的改變數據庫請求指各種filter()、exclude()等等最終會改變SQL代碼的操作。而all()并不會改變最終的數據庫請求,因此是不會導致重新請求數據庫的。

舉個例子,要獲取所有人訪問過的城市中帶有“市”字的城市,這樣做會導致大量的SQL查詢:
 

plist = Person.objects.prefetch_related('visitation')[p.visitation.filter(name__icontains=u"市") for p in plist]

因為數據庫中有4人,導致了2+4次SQL查詢:
 

SELECT `QSOptimize_person`.`id`, `QSOptimize_person`.`firstname`, `QSOptimize_person`.`lastname`,`QSOptimize_person`.`hometown_id`, `QSOptimize_person`.`living_id`FROM `QSOptimize_person`; SELECT (`QSOptimize_person_visitation`.`person_id`) AS `_prefetch_related_val`, `QSOptimize_city`.`id`,`QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE `QSOptimize_person_visitation`.`person_id` IN (1, 2, 3, 4); SELECT `QSOptimize_city`.`id`, `QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE(`QSOptimize_person_visitation`.`person_id` = 1 AND `QSOptimize_city`.`name` LIKE '%市%' ); SELECT `QSOptimize_city`.`id`, `QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE (`QSOptimize_person_visitation`.`person_id` = 2 AND `QSOptimize_city`.`name` LIKE '%市%' ); SELECT `QSOptimize_city`.`id`, `QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE (`QSOptimize_person_visitation`.`person_id` = 3 AND `QSOptimize_city`.`name` LIKE '%市%' ); SELECT `QSOptimize_city`.`id`, `QSOptimize_city`.`name`, `QSOptimize_city`.`province_id`FROM `QSOptimize_city`INNER JOIN `QSOptimize_person_visitation` ON (`QSOptimize_city`.`id` = `QSOptimize_person_visitation`.`city_id`)WHERE (`QSOptimize_person_visitation`.`person_id` = 4 AND `QSOptimize_city`.`name` LIKE '%市%' );

詳細分析一下這些請求事件。

眾所周知,QuerySet是lazy的,要用的時候才會去訪問數據庫。運行到第二行Python代碼時,for循環將plist看做iterator,這會觸發數據庫查詢。最初的兩次SQL查詢就是prefetch_related導致的。

雖然已經查詢結果中包含所有所需的city的信息,但因為在循環體中對Person.visitation進行了filter操作,這顯然改變了數據庫請求。因此這些操作會忽略掉之前緩存到的數據,重新進行SQL查詢。

但是如果有這樣的需求了應該怎么辦呢?在Django >= 1.7,可以通過下一節的Prefetch對象來實現,如果你的環境是Django < 1.7,可以在Python中完成這部分操作。
 

plist = Person.objects.prefetch_related('visitation')[[city for city in p.visitation.all() if u"市" in city.name] for p in plist]

Prefetch 對象

在Django >= 1.7,可以用Prefetch對象來控制prefetch_related函數的行為。

注:由于我沒有安裝1.7版本的Django環境,本節內容是參考Django文檔寫的,沒有進行實際的測試。

Prefetch對象的特征:

  •     一個Prefetch對象只能指定一項prefetch操作。
  •     Prefetch對象對字段指定的方式和prefetch_related中的參數相同,都是通過雙下劃線連接的字段名完成的。
  •     可以通過 queryset 參數手動指定prefetch使用的QuerySet。
  •     可以通過 to_attr 參數指定prefetch到的屬性名。
  •     Prefetch對象和字符串形式指定的lookups參數可以混用。

繼續上面的例子,獲取所有人訪問過的城市中帶有“武”字和“州”的城市:
 

wus = City.objects.filter(name__icontains = u"武")zhous = City.objects.filter(name__icontains = u"州")plist = Person.objects.prefetch_related(  Prefetch('visitation', queryset = wus, to_attr = "wu_city"),  Prefetch('visitation', queryset = zhous, to_attr = "zhou_city"),)[p.wu_city for p in plist][p.zhou_city for p in plist]

注:這段代碼沒有在實際環境中測試過,若有不正確的地方請指正。

順帶一提,Prefetch對象和字符串參數可以混用。
None

可以通過傳入一個None來清空之前的prefetch_related。就像這樣:

>>> prefetch_cleared_qset = qset.prefetch_related(None)

小結

  1.     prefetch_related主要針一對多和多對多關系進行優化。
  2.     prefetch_related通過分別獲取各個表的內容,然后用Python處理他們之間的關系來進行優化。
  3.     可以通過可變長參數指定需要select_related的字段名。指定方式和特征與select_related是相同的。
  4.     在Django >= 1.7可以通過Prefetch對象來實現復雜查詢,但低版本的Django好像只能自己實現。
  5.     作為prefetch_related的參數,Prefetch對象和字符串可以混用。
  6.     prefetch_related的鏈式調用會將對應的prefetch添加進去,而非替換,似乎沒有基于不同版本上區別。
  7.     可以通過傳入None來清空之前的prefetch_related。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 永清县| 舞阳县| 哈巴河县| 闵行区| 平阴县| 天峨县| 邮箱| 紫金县| 静乐县| 浦北县| 临安市| 东莞市| 隆林| 鲜城| 通河县| 芒康县| 保靖县| 永川市| 海门市| 原平市| 六盘水市| 南通市| 西安市| 布拖县| 墨江| 宝应县| 临城县| 石城县| 临猗县| 邵东县| 金塔县| 涡阳县| 惠东县| 甘肃省| 安宁市| 桓台县| 罗平县| 贵南县| 古蔺县| 子长县| 深水埗区|