国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

簡單學習Python多進程Multiprocessing

2020-01-04 16:50:09
字體:
來源:轉載
供稿:網友

1.1 什么是 Multiprocessing

多線程在同一時間只能處理一個任務。

可把任務平均分配給每個核,而每個核具有自己的運算空間。

1.2 添加進程 Process

與線程類似,如下所示,但是該程序直接運行無結果,因為IDLE不支持多進程,在命令行終端運行才有結果顯示

import multiprocessing as mpdef job(a,b): print('abc')if __name__=='__main__': p1=mp.Process(target=job,args=(1,2)) p1.start() p1.join()

1.3 存儲進程輸出 Queue

不知道為什么下面的這個程序可以在IDLE中正常運行。首先定義了一個job函數作系列數學運算,然后將結果放到res中,在main函數運行,取出queue中存儲的結果再進行一次加法運算。

import multiprocessing as mpdef job(q): res=0 for i in range(1000): res+=i+i**2+i**3 q.put(res) if __name__ == '__main__': q=mp.Queue() p1 = mp.Process(target=job,args=(q,))#注意當參數只有一個時,應加上逗號 p2 = mp.Process(target=job,args=(q,))  p1.start() p2.start()  p1.join() p2.join() res1=q.get() res2=q.get() print(res1+res2)

結果如下所示:

 Python,多進程,Multiprocessing

1.4 效率比對 threading & multiprocessing

在job函數中定義了數學運算,比較正常情況、多線程和多進程分別的運行時間。

import multiprocessing as mpimport threading as tdimport timedef job(q): res = 0 for i in range(10000000): res += i+i**2+i**3 q.put(res) # queuedef multicore(): q = mp.Queue() p1 = mp.Process(target=job, args=(q,)) p2 = mp.Process(target=job, args=(q,)) p1.start() p2.start() p1.join() p2.join() res1 = q.get() res2 = q.get() print('multicore:' , res1+res2)def normal(): res = 0 for _ in range(2):#線程或進程都構造了兩個,進行了兩次運算,所以這里循環兩次 for i in range(10000000):  res += i+i**2+i**3 print('normal:', res)def multithread(): q = mp.Queue() t1 = td.Thread(target=job, args=(q,)) t2 = td.Thread(target=job, args=(q,)) t1.start() t2.start() t1.join() t2.join() res1 = q.get() res2 = q.get() print('multithread:', res1+res2)if __name__ == '__main__': st = time.time() normal() st1= time.time() print('normal time:', st1 - st) multithread() st2 = time.time() print('multithread time:', st2 - st1) multicore() print('multicore time:', time.time()-st2)

在視頻中的運行結果是多進程<正常<多線程,而我的運行結果為下圖所示:

Python,多進程,Multiprocessing

綜上,多核/多進程運行最快,說明在同時間運行了多個任務,而多線程卻不一定會比正常情況下的運行來的快,這和多線程中的GIL有關。

1.5 進程池

進程池Pool,就是我們將所要運行的東西,放到池子里,Python會自行解決多進程的問題。

import multiprocessing as mpdef job(x): return x*xdef multicore(): pool=mp.Pool(processes=2)#定義一個Pool,并定義CPU核數量為2 res=pool.map(job,range(10)) print(res) res=pool.apply_async(job,(2,)) print(res.get()) multi_res=[pool.apply_async(job,(i,)) for i in range(10)] print([res.get()for res in multi_res])if __name__=='__main__': multicore()

運行結果如下所示:

Python,多進程,Multiprocessing

首先定義一個池子,有了池子之后,就可以讓池子對應某一個函數,在上述代碼中定義的pool對應job函數。我們向池子里丟數據,池子就會返回函數返回的值。 Pool和之前的Process的不同點是丟向Pool的函數有返回值,而Process的沒有返回值。

接下來用map()獲取結果,在map()中需要放入函數和需要迭代運算的值,然后它會自動分配給CPU核,返回結果

 Python,多進程,Multiprocessing

我們怎么知道Pool是否真的調用了多個核呢?我們可以把迭代次數增大些,然后打開CPU負載看下CPU運行情況

打開CPU負載(Mac):活動監視器 > CPU > CPU負載(單擊一下即可)

Pool默認大小是CPU的核數,我們也可以通過在Pool中傳入processes參數即可自定義需要的核數量。

Pool除了可以用map來返回結果之外,還可以用apply_async(),與map不同的是,只能傳遞一個值,只會放入一個核進行計算,但是傳入值時要注意是可迭代的,所以在傳入值后需要加逗號, 同時需要用get()方法獲取返回值。所對應的代碼為:

res=pool.apply_async(job,(2,))print(res.get())

運行結果為4。

由于傳入值是可以迭代的,則我們同樣可以使用apply_async()來輸出多個結果。如果在apply_async()中輸入多個傳入值:

res = pool.apply_async(job, (2,3,4,))

結果會報錯:

TypeError: job() takes exactly 1 argument (3 given)

即apply_async()只能輸入一組參數。

在此我們將apply_async()放入迭代器中,定義一個新的multi_res

multi_res = [pool.apply_async(job, (i,)) for i in range(10)]

同樣在取出值時需要一個一個取出來

print([res.get() for res in multi_res])

apply用迭代器的運行結果與map取出的結果相同。

note:

(1)Pool默認調用是CPU的核數,傳入processes參數可自定義CPU核數

(2)map() 放入迭代參數,返回多個結果

(3)apply_async()只能放入一組參數,并返回一個結果,如果想得到map()的效果需要通過迭代

1.6 共享內存 shared memory

只有通過共享內存才能讓CPU之間進行交流。

通過Value將數據存儲在一個共享的內存表中。

import multiprocessing as mpvalue1 = mp.Value('i', 0) value2 = mp.Value('d', 3.14)

 其中,i和d表示數據類型。i為帶符號的整型,d為雙精浮點類型。更多數據類型可參考網址:https://docs.python.org/3/library/array.html

在多進程中有一個Array類,可以和共享內存交互,來實現進程之間共享數據。

和numpy中的不同,這里的Array只能是一維的,并且需要定義數據類型否則會報錯。

array = mp.Array('i', [1, 2, 3, 4])

1.7 進程鎖 Lock

首先是不加進程鎖的運行情況,在下述代碼中定義了共享變量v,定義了兩個進程,均可對v進行操作。job函數的作用是每隔0.1s輸出一次累加num的值,累加值num在兩個進程中分別為1和3。

import multiprocessing as mpimport timedef job(v,num): for _ in range(10): time.sleep(0.1)#暫停0.1s,讓輸出效果更明顯 v.value+=num #v.value獲取共享變量值 print(v.value) def multicore(): v=mp.Value('i',0)#定義共享變量 p1=mp.Process(target=job,args=(v,1)) p2=mp.Process(target=job,args=(v,3)) p1.start() p2.start() p1.join() p2.join()if __name__=='__main__': multicore()

 運行結果如下所示:

Python,多進程,Multiprocessing

可以看到兩個進程互相搶占共享內存v。

為了解決上述不同進程搶共享資源的問題,我們可以用加進程鎖來解決。

首先需要定義一個進程鎖:

 l = mp.Lock() # 定義一個進程鎖

然后將進程鎖的信息傳入各個進程中

 p1 = mp.Process(target=job, args=(v,1,l)) # 需要將Lock傳入 p2 = mp.Process(target=job, args=(v,3,l)) 

在job()中設置進程鎖的使用,保證運行時一個進程的對鎖內內容的獨占

def job(v, num, l): l.acquire() # 鎖住 for _ in range(5): time.sleep(0.1)  v.value += num # v.value獲取共享內存 print(v.value) l.release() # 釋放

完整代碼:

def job(v, num, l): l.acquire() # 鎖住 for _ in range(5): time.sleep(0.1)  v.value += num # 獲取共享內存 print(v.value) l.release() # 釋放def multicore(): l = mp.Lock() # 定義一個進程鎖 v = mp.Value('i', 0) # 定義共享內存 p1 = mp.Process(target=job, args=(v,1,l)) # 需要將lock傳入 p2 = mp.Process(target=job, args=(v,3,l))  p1.start() p2.start() p1.join() p2.join()if __name__ == '__main__': multicore()

運行結果如下所示:

Python,多進程,Multiprocessing

可以看到進程1運行完之后才運行進程2。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持VEVB武林網。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 云龙县| 乃东县| 翼城县| 阿拉善左旗| 泽州县| 沅江市| 婺源县| 长子县| 安阳县| 安陆市| 和平区| 嘉鱼县| 固阳县| 鄂尔多斯市| 白玉县| 东山县| 丽水市| 灵武市| 大邑县| 景德镇市| 乌海市| 香格里拉县| 保靖县| 桑日县| 清徐县| 栾川县| 云梦县| 长寿区| 永宁县| 府谷县| 兴隆县| 梅河口市| 平顶山市| 丰都县| 安吉县| 沐川县| 疏勒县| 收藏| 永和县| 当涂县| 登封市|