微處理器存儲(chǔ)體系結(jié)構(gòu)優(yōu)化關(guān)鍵技術(shù)研究
【文章頁(yè)數(shù)】:175 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.1存儲(chǔ)墻問題示意圖
多核眾核處理器的處理能力的快速穩(wěn)定增長(zhǎng)需要存儲(chǔ)帶寬以同步的速度跟上。但很遺憾的是,存儲(chǔ)單元的處理速度提升始終沒有跟上處理器的處理速度提升,這也就造成了所謂的存儲(chǔ)墻問題,F(xiàn)代的數(shù)據(jù)中心處理的巨額數(shù)據(jù)量也加劇了存儲(chǔ)系統(tǒng)上的壓力,如今的SRAM-DRAM存儲(chǔ)系統(tǒng)結(jié)構(gòu)已經(jīng)幾乎無法滿足了。....
圖5.12HMCSP在隨機(jī)的十個(gè)稀疏矩陣上運(yùn)行訪存延遲的比較
為了全面的測(cè)試不同類型的稀疏矩陣,我們?cè)贖MCSP上測(cè)試了10個(gè)案例。這10個(gè)稀疏矩陣的行列數(shù)以及稀疏指數(shù)都是隨機(jī)的,因此這些例子基本覆蓋了各種情況。從圖5.12中可以看出,對(duì)于不同種類的稀疏矩陣,平均HMCSP可以有效地降低49.7%的傳輸延遲。這是由于HMC的PIM能力可以用....
圖5.13HMCSP在隨機(jī)的十個(gè)稀疏矩陣上性能的比較
圖5.12HMCSP在隨機(jī)的十個(gè)稀疏矩陣上運(yùn)行訪存延遲的比較圖5.13展示了HMCSP作用在基于CSR的SPMV的性能。SPMV是一種典型的訪存密集型的應(yīng)用程序,訪存指令的擁塞很大程度上影響了總體性能。由于HMCSP減少了訪存指令并良好利用了延遲更短的原子計(jì)算操作,CSR-SP....
圖5.14在不同系數(shù)矩陣大小以及稀疏系數(shù)的情況下HMCSP的傳輸延遲比較
對(duì)于矩陣參數(shù)的分析主要涉及到矩陣大小以及矩陣稀疏指數(shù)。圖5.14(a)展示了在固定矩陣稀疏系數(shù)的情況下改變不同行列的性能變化。圖中的五個(gè)應(yīng)用程序從左到右矩陣大小在增加,可以看出,隨著矩陣大小的增加,HMCSP效率越來越高。將案例1與案例5比較的話,可以看出案例5比案例1多減少了3....
本文編號(hào):3985178
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xxkjbs/3985178.html