python的迭代器與生成器實例詳解

2019-11-25 18:19:14

字體：大中小

供稿：網(wǎng)友

本文以實例詳解了python的迭代器與生成器，具體如下所示：

1. 迭代器概述：

迭代器是訪問集合元素的一種方式。迭代器對象從集合的第一個元素開始訪問，直到所有的元素被訪問完結(jié)束。迭代器只能往前不會后退，不過這也沒什么，因為人們很少在迭代途中往后退。

1.1 使用迭代器的優(yōu)點

對于原生支持隨機(jī)訪問的數(shù)據(jù)結(jié)構(gòu)（如tuple、list），迭代器和經(jīng)典for循環(huán)的索引訪問相比并無優(yōu)勢，反而丟失了索引值（可以使用內(nèi)建函數(shù)enumerate()找回這個索引值）。但對于無法隨機(jī)訪問的數(shù)據(jù)結(jié)構(gòu)（比如set）而言，迭代器是唯一的訪問元素的方式。

另外，迭代器的一大優(yōu)點是不要求事先準(zhǔn)備好整個迭代過程中所有的元素。迭代器僅僅在迭代到某個元素時才計算該元素，而在這之前或之后，元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合，比如幾個G的文件，或是斐波那契數(shù)列等等。

迭代器更大的功勞是提供了一個統(tǒng)一的訪問集合的接口，只要定義了__iter__()方法對象，就可以使用迭代器訪問。

迭代器有兩個基本的方法

next方法：返回迭代器的下一個元素
__iter__方法：返回迭代器對象本身
下面用生成斐波那契數(shù)列為例子，說明為何用迭代器

示例代碼1

 def fab(max):   n, a, b = 0, 0, 1   while n < max:     print b     a, b = b, a + b     n = n + 1

直接在函數(shù)fab(max)中用print打印會導(dǎo)致函數(shù)的可復(fù)用性變差，因為fab返回None。其他函數(shù)無法獲得fab函數(shù)返回的數(shù)列。

示例代碼2

 def fab(max):   L = []  n, a, b = 0, 0, 1   while n < max:     L.append(b)     a, b = b, a + b     n = n + 1  return L

代碼2滿足了可復(fù)用性的需求，但是占用了內(nèi)存空間，最好不要。

示例代碼3

對比：

for i in range(1000): passfor i in xrange(1000): pass

前一個返回1000個元素的列表，而后一個在每次迭代中返回一個元素，因此可以使用迭代器來解決復(fù)用可占空間的問題

 class Fab(object):   def __init__(self, max):     self.max = max     self.n, self.a, self.b = 0, 0, 1    def __iter__(self):     return self    def next(self):     if self.n < self.max:       r = self.b       self.a, self.b = self.b, self.a + self.b       self.n = self.n + 1       return r     raise StopIteration()

執(zhí)行

>>> for key in Fabs(5):  print key

Fabs 類通過 next() 不斷返回數(shù)列的下一個數(shù)，內(nèi)存占用始終為常數(shù)　　

1.2 使用迭代器

使用內(nèi)建的工廠函數(shù)iter(iterable)可以獲取迭代器對象：

>>> lst = range(5)>>> it = iter(lst)>>> it<listiterator object at 0x01A63110>

使用next()方法可以訪問下一個元素：

>>> it.next() >>> it.next() >>> it.next()

python處理迭代器越界是拋出StopIteration異常

>>> it.next() >>> it.next<method-wrapper 'next' of listiterator object at 0x01A63110>>>> it.next() >>> it.next() Traceback (most recent call last): File "<pyshell#27>", line 1, in <module>  it.next()StopIteration

了解了StopIteration，可以使用迭代器進(jìn)行遍歷了

lst = range(5)it = iter(lst)try:  while True:    val = it.next()    print valexcept StopIteration:  pass

事實上，因為迭代器如此普遍，python專門為for關(guān)鍵字做了迭代器的語法糖。在for循環(huán)中，Python將自動調(diào)用工廠函數(shù)iter()獲得迭代器，自動調(diào)用next()獲取元素，還完成了檢查StopIteration異常的工作。如下

>>> a = (1, 2, 3, 4)>>> for key in a:  print key

首先python對關(guān)鍵字in后的對象調(diào)用iter函數(shù)迭代器，然后調(diào)用迭代器的next方法獲得元素，直到拋出StopIteration異常。

1.3 定義迭代器

下面一個例子――斐波那契數(shù)列

# -*- coding: cp936 -*-class Fabs(object):  def __init__(self,max):    self.max = max    self.n, self.a, self.b = 0, 0, 1 #特別指出：第0項是0，第1項是第一個1.整個數(shù)列從1開始  def __iter__(self):    return self  def next(self):    if self.n < self.max:      r = self.b      self.a, self.b = self.b, self.a + self.b      self.n = self.n + 1      return r    raise StopIteration() print Fabs(5)for key in Fabs(5):  print key

結(jié)果

<__main__.Fabs object at 0x01A63090>

2. 迭代器

帶有 yield 的函數(shù)在 Python 中被稱之為 generator（生成器），幾個例子說明下（還是用生成斐波那契數(shù)列說明）

可以看出代碼3遠(yuǎn)沒有代碼1簡潔，生成器（yield）既可以保持代碼1的簡潔性，又可以保持代碼3的效果

示例代碼4　

def fab(max):  n, a, b = 0, 0, 1  while n < max:    yield b    a, b = b, a + b    n = n = 1

執(zhí)行

>>> for n in fab(5):  print n

簡單地講，yield 的作用就是把一個函數(shù)變成一個 generator，帶有 yield 的函數(shù)不再是一個普通函數(shù)，Python 解釋器會將其視為一個 generator，調(diào)用 fab(5) 不會執(zhí)行 fab 函數(shù)，而是返回一個 iterable 對象！在 for 循環(huán)執(zhí)行時，每次循環(huán)都會執(zhí)行 fab 函數(shù)內(nèi)部的代碼，執(zhí)行到 yield b 時，fab 函數(shù)就返回一個迭代值，下次迭代時，代碼從 yield b 的下一條語句繼續(xù)執(zhí)行，而函數(shù)的本地變量看起來和上次中斷執(zhí)行前是完全一樣的，于是函數(shù)繼續(xù)執(zhí)行，直到再次遇到 yield。看起來就好像一個函數(shù)在正常執(zhí)行的過程中被 yield 中斷了數(shù)次，每次中斷都會通過 yield 返回當(dāng)前的迭代值。

也可以手動調(diào)用 fab(5) 的 next() 方法（因為 fab(5) 是一個 generator 對象，該對象具有 next() 方法），這樣我們就可以更清楚地看到 fab 的執(zhí)行流程：

>>> f = fab(3)>>> f.next()1>>> f.next()1>>> f.next()2>>> f.next() Traceback (most recent call last): File "<pyshell#62>", line 1, in <module>  f.next()StopIteration

return作用

在一個生成器中，如果沒有return，則默認(rèn)執(zhí)行到函數(shù)完畢；如果遇到return,如果在執(zhí)行過程中 return，則直接拋出 StopIteration 終止迭代。例如

>>> s = fab(5)>>> s.next()1>>> s.next() Traceback (most recent call last): File "<pyshell#66>", line 1, in <module>  s.next()StopIteration

示例代碼5 文件讀取

 def read_file(fpath):   BLOCK_SIZE = 1024   with open(fpath, 'rb') as f:     while True:       block = f.read(BLOCK_SIZE)       if block:         yield block       else:         return

如果直接對文件對象調(diào)用 read() 方法，會導(dǎo)致不可預(yù)測的內(nèi)存占用。好的方法是利用固定長度的緩沖區(qū)來不斷讀取文件內(nèi)容。通過 yield，我們不再需要編寫讀文件的迭代類，就可以輕松實現(xiàn)文件讀取。

上一篇：Python下singleton模式的實現(xiàn)方法

下一篇：Python的內(nèi)存泄漏及gc模塊的使用分析