關(guān)于“調(diào)整后的峰值性能(APP)”的技術(shù)注釋
調(diào)整后的峰值性能(APP)是指數(shù)字計算機在進行64位或更多位的浮點加法和乘法運算的調(diào)整后的峰值速度。
本技術(shù)說明涉及的縮寫:
n “數(shù)字計算機”中的處理器數(shù)量
I 處理器編號(1,……,n)
ti 處理器時鐘周期(ti=1/Fi)
Fi 處理器頻率
Ri 峰值浮點運算速度
Wi 體系結(jié)構(gòu)調(diào)整因子
APP用加權(quán)萬億次浮點運算(Weighted TeraFLOPS (WT))表示,單位是1012調(diào)整后的每秒浮點運算。
APP的計算方法如下:
1.確定數(shù)字計算機中的每個處理器i在每個時鐘周期內(nèi)執(zhí)行的64位或更多位的峰值浮點操作次數(shù)(FPOi)。
注: 在確定FPO時,僅包括64位或更多位浮點加法、浮點乘法運算。所有浮點運算必須表示為每個處理器時鐘周期所執(zhí)行的運算次數(shù);需要多個時鐘周期完成的運算 可以表示為每個時鐘周期完成運算的分數(shù)值。對于不能進行64位或更多位浮點操作數(shù)的處理器,其有效浮點運算速度R為0。
2.計算每個處理器的浮點運算速度R,Ri= FPOi/ ti
3.計算APP,APP=W1×R1+ W2×R2+…+ Wn×Rn
4.對于“向量處理器”,Wi=0.9;對于非“向量處理器”,Wi=0.3
注1:對于在一個時鐘周期內(nèi)能夠完成復合運算的處理器,比如:同時進行加法和乘法運算,所有運算次數(shù)都計算在內(nèi)。
注2:就流水線處理器而言,有效浮點運算速度R取流水線滿時的流水線速度,或非流水線速度中的較高值。
注3:在計算APP之前,應(yīng)先對每個參與運算的處理器,按照其最大可能的理論值來計算其運算速度R。如果計算機生產(chǎn)商在手冊或資料中聲稱,該計算機能夠進行并發(fā)、并行、同時操作或運行,則在計算R時,應(yīng)考慮同時操作的因素。
注4:計算APP時,不應(yīng)考慮那些僅負責輸出/輸入和外部設(shè)備功能(如:磁盤驅(qū)動器、通信及視頻顯示等)的處理器。
注5:計算APP的值,不考慮通過“局域網(wǎng)”、廣域網(wǎng)、I/O共享連接或共享設(shè)備、I/O控制器以及任何由“軟件”實現(xiàn)通訊互連的處理器組合。
注6: 計算APP的值,必須包括通過聚合、同時運算和共享內(nèi)存方式專門設(shè)計用于增強系統(tǒng)性能的處理器組合。
技術(shù)說明:
1)聚合在同一芯片上的所有同時運行的處理器和加速器;
2)處理器組合共享內(nèi)存方式,是任一處理器通過高速緩存塊或存儲字的硬件傳輸、不用任何的軟件機制可以訪問系統(tǒng)中的任一內(nèi)存地址。該方式可以通過2.2中規(guī)定的“電子組件”獲得。
注7:“向量處理器”定義為內(nèi)置向量指令的處理器,這些指令能夠同時進行多重浮點向量(64位或更多位的一維數(shù)組)運算,且處理器中至少含有2個向量功能部件和至少8個向量寄存器,每個向量寄存器至少包含64個數(shù)據(jù)單元。