国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<small id="lvy8t"></small>

首頁(yè) > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

Multicore Programming OpenMP: Part 2

2019-11-14 13:01:52

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

CPU無(wú)法達(dá)到peak performance的原因矩陣乘法的討論介紹理論基礎(chǔ)塊狀矩陣計(jì)算優(yōu)化技巧代價(jià)模型strength reduction內(nèi)聯(lián)函數(shù)inline f循環(huán)展開loop unrolling去掉下標(biāo)計(jì)算sub-exPRession eliminate查表look up table合并循環(huán)減少條件判斷

轉(zhuǎn)載請(qǐng)注明出處：http://blog.csdn.net/c602273091/article/details/54851077

上一節(jié)說到的是OpenMP的寫法，這一次主要是介紹代碼優(yōu)化。

CPU無(wú)法達(dá)到peak performance的原因

這里寫圖片描述本來CPU的性能應(yīng)該如上圖所示的，但是實(shí)際使用的時(shí)候并沒有達(dá)到這個(gè)效果。

主要是因?yàn)椋?/p>

存儲(chǔ)器的層次設(shè)計(jì)。發(fā)生cache、TLB miss的時(shí)候，就需要等待很多個(gè)周期；

流水線、ILP等等并行設(shè)計(jì)有缺陷，使得吞吐量無(wú)法達(dá)到預(yù)期；

有的操作比如存儲(chǔ)操作看似不需要浪費(fèi)周期，其實(shí)數(shù)據(jù)傳輸?shù)鹊葧?huì)浪費(fèi)不少周期。

矩陣乘法的討論

介紹

這里寫圖片描述原始的矩陣乘法就如上圖的實(shí)現(xiàn)。

但是使用加速之后效果怎么樣呢？ATLAS做加速的效果遠(yuǎn)遠(yuǎn)超過了三個(gè)循環(huán)的矩陣計(jì)算。這里寫圖片描述

理論基礎(chǔ)

在這里需要介紹一些存儲(chǔ)器方面的知識(shí)。

這里寫圖片描述矩陣存儲(chǔ)分為行優(yōu)先和列優(yōu)先的。行列優(yōu)先的不同使得每次存入cache的一行是列方向或者是行方向。

現(xiàn)在解構(gòu)一下取數(shù)據(jù)的關(guān)系：這里寫圖片描述

對(duì)存儲(chǔ)數(shù)組A、B、C計(jì)算讀取次數(shù)。這里寫圖片描述

塊狀矩陣計(jì)算

使用塊狀計(jì)算矩陣，如下圖。那么之前計(jì)算矩陣就改成了四個(gè)循環(huán)。這里寫圖片描述

想對(duì)這塊更了解，可以看我之前寫的18-600里cache的介紹。想直觀看這個(gè)算法，可以看：這里寫圖片描述

優(yōu)化技巧

代價(jià)模型

計(jì)算代價(jià)的部分如下圖：（左邊是具體每部分、右邊是具體例子）這里寫圖片描述

計(jì)算一開始的代價(jià)：19n 這里寫圖片描述

去掉結(jié)構(gòu)體，去掉了索引這個(gè)步驟：6n 這里寫圖片描述

改變循環(huán)體內(nèi)部可以移出的操作：5n 這里寫圖片描述

使用循環(huán)展開：3.5n 這里寫圖片描述

strength reduction

減少需要浪費(fèi)很多資源的操作，比如去掉除法、log等等或者替換成別的操作。這里寫圖片描述

內(nèi)聯(lián)函數(shù)（inline f）

這里寫圖片描述減少函數(shù)調(diào)用，把簡(jiǎn)單函數(shù)改成內(nèi)聯(lián)函數(shù)。

循環(huán)展開（loop unrolling）

這里寫圖片描述這里主要是涉及CPU在取內(nèi)存中數(shù)據(jù)到寄存器的時(shí)候，循環(huán)展開可以減少CPU周期。

去掉下標(biāo)計(jì)算（sub-expression eliminate）

這里寫圖片描述有時(shí)候計(jì)算循環(huán)中的下表很浪費(fèi)CPU周期，一部分放到循環(huán)外就可以加快速度。

查表（look up table）

這里寫圖片描述提前計(jì)算好要用到的一些數(shù)據(jù)，尤其減少循環(huán)多次計(jì)算的浪費(fèi)。這個(gè)做法和暴力破解很像。

合并循環(huán)

這里寫圖片描述減少循環(huán)次數(shù)，可以減少不少計(jì)數(shù)器的操作。

減少條件判斷

減少循環(huán)中的條件判斷，如果你提前知道哪個(gè)是需要跳過的。這里寫圖片描述

上一篇：(函數(shù)題)4-10 階乘計(jì)算升級(jí)版

下一篇：windows---窗口

學(xué)習(xí)交流

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點(diǎn)

榮耀總裁趙明烏鎮(zhèn)演講：榮耀首款5G手機(jī)V30下月發(fā)布

2019-10-23 09:17:05

搜狐張朝陽(yáng)：回歸媒體是搜狐重新崛起的關(guān)鍵

2019-10-21 09:20:02

華為輪值董事長(zhǎng)郭平：虛擬技術(shù)創(chuàng)造現(xiàn)實(shí)價(jià)值

2019-10-21 09:00:12

滴滴英文服務(wù)上線兩周年用戶已超200萬(wàn)

2019-09-26 08:57:12

華為推出全球至快AI訓(xùn)練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國(guó)技術(shù)團(tuán)隊(duì)

2019-09-25 08:15:43

疑難解答

圖片精選

網(wǎng)友關(guān)注

主站蜘蛛池模板：渭源县| 鞍山市| 长白| 铜陵市| 平定县| 兰溪市| 昌平区| 英超| 巴青县| 康平县| 右玉县| 德保县| 六盘水市| 离岛区| 永丰县| 孝昌县| 通海县| 桦甸市| 巴南区| 西乌珠穆沁旗| 安化县| 新干县| 银川市| 三穗县| 县级市| 深水埗区| 南平市| 克东县| 定日县| 安仁县| 拜泉县| 嘉义县| 隆林| 新余市| 灵宝市| 科技| 广西| 同江市| 金华市| 阜城县| 襄汾县|