同一個(gè)算法在具有8個(gè)物理內(nèi)核的微處理器上的最大加速比也就是1.77x。因此,增加了這么多物理內(nèi)核之后代碼也還需要至少562.5秒的時(shí)間完成。
最大加速比(倍數(shù)) = 1 / ((1 - 0.50) + (0.50 / 8)) = 1.77x
圖1-9展示了這個(gè)算法在物理內(nèi)核數(shù)為1~16的時(shí)候的加速比。從圖中可以看出,加速比并不是線性變化的。隨著內(nèi)核數(shù)的增加,處理資源的浪費(fèi)也越多。圖1-10展示了同樣的內(nèi)容,只不過使用了新版本的算法,其中總?cè)蝿?wù)的90%(P=0.90)都是并行執(zhí)行的。事實(shí)上,90%的并行率是非常高的成就了,但在具有16個(gè)物理內(nèi)核的微處理器上只獲得了6.40x的加速比。
最大加速比(倍數(shù)) = 1 / ((1 - 0.90) + (0.90 / 16)) = 6.40x