注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)硬件、外部設(shè)備與維護(hù)計(jì)算機(jī)組成與設(shè)計(jì):硬件/軟件接口(原書(shū)第5版·ARM版)

計(jì)算機(jī)組成與設(shè)計(jì):硬件/軟件接口(原書(shū)第5版·ARM版)

計(jì)算機(jī)組成與設(shè)計(jì):硬件/軟件接口(原書(shū)第5版·ARM版)

定 價(jià):¥139.00

作 者: [美] 大衛(wèi)·A.帕特森(David,A.,Patterson),約翰·L.亨尼斯(Joh 著,陳微譯 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787111608943 出版時(shí)間: 2018-10-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 501 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)由2017年圖靈獎(jiǎng)得主Patterson和Hennessy共同撰寫(xiě),是計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域的經(jīng)典教材,強(qiáng)調(diào)軟硬件協(xié)同設(shè)計(jì)及其對(duì)性能的影響。本書(shū)采用ARMv8體系結(jié)構(gòu),講解硬件技術(shù)、匯編語(yǔ)言、計(jì)算機(jī)算術(shù)運(yùn)算、流水線、存儲(chǔ)器層次結(jié)構(gòu)以及I/O的基本原理。新內(nèi)容涵蓋平板電腦、云基礎(chǔ)設(shè)施、ARM(移動(dòng)計(jì)算設(shè)備)以及x86(云計(jì)算)體系結(jié)構(gòu),新實(shí)例包括IntelCorei7、ARMCortex-A53以及NVIDIAFermiGPU。本書(shū)適合作為高等院校計(jì)算機(jī)專業(yè)的教材,也適合廣大專業(yè)技術(shù)人員參考。

作者簡(jiǎn)介

暫缺《計(jì)算機(jī)組成與設(shè)計(jì):硬件/軟件接口(原書(shū)第5版·ARM版)》作者簡(jiǎn)介

圖書(shū)目錄

出版者的話
贊譽(yù)
譯者序
前言
作者簡(jiǎn)介
第1章 計(jì)算機(jī)的抽象與技術(shù) 1
1.1 引言 1
1.1.1 計(jì)算機(jī)應(yīng)用的分類和特點(diǎn) 2
1.1.2 歡迎來(lái)到后PC時(shí)代 3
1.1.3 你能從本書(shū)中學(xué)到什么 4
1.2 計(jì)算機(jī)體系結(jié)構(gòu)中的8個(gè)偉大思想 6
1.2.1 面向摩爾定律的設(shè)計(jì) 6
1.2.2 使用抽象簡(jiǎn)化設(shè)計(jì) 7
1.2.3 加速大概率事件 7
1.2.4 通過(guò)并行提高性能 7
1.2.5 通過(guò)流水線提高性能 7
1.2.6 通過(guò)預(yù)測(cè)提高性能 7
1.2.7 存儲(chǔ)器層次結(jié)構(gòu) 7
1.2.8 通過(guò)冗余提高可靠性 7
1.3 程序表象之下 8
1.4 硬件包裝之下 10
1.4.1 顯示器 11
1.4.2 觸摸屏 12
1.4.3 打開(kāi)機(jī)箱 13
1.4.4 數(shù)據(jù)的安全存儲(chǔ) 15
1.4.5 與其他計(jì)算機(jī)通信 16
1.5 處理器和存儲(chǔ)器制造技術(shù) 17
1.6 性能 20
1.6.1 性能的定義 20
1.6.2 性能的度量 22
1.6.3 CPU的性能及其度量因素 24
1.6.4 指令的性能 24
1.6.5 經(jīng)典的CPU性能公式 25
1.7 功耗墻 28
1.8 滄海巨變:從單處理器向多處理器轉(zhuǎn)變 29
1.9 實(shí)例:Intel Core i7基準(zhǔn)測(cè)試 32
1.9.1 SPEC CPU基準(zhǔn)測(cè)試程序 32
1.9.2 SPEC功耗基準(zhǔn)測(cè)試程序 34
1.10 謬誤與陷阱 34
1.11 本章小結(jié) 36
1.12 歷史觀點(diǎn)與拓展閱讀 37
1.13 練習(xí)題 38
第2章 指令:計(jì)算機(jī)的語(yǔ)言 42
2.1 引言 42
2.2 計(jì)算機(jī)硬件的操作 44
2.3 計(jì)算機(jī)硬件的操作數(shù) 46
2.3.1 存儲(chǔ)器操作數(shù) 47
2.3.2 常數(shù)或立即數(shù)操作數(shù) 50
2.4 有符號(hào)數(shù)和無(wú)符號(hào)數(shù) 51
2.5 計(jì)算機(jī)中指令的表示 56
2.6 邏輯操作 61
2.7 決策指令 64
2.7.1 循環(huán) 65
2.7.2 邊界檢查的簡(jiǎn)便方法 67
2.7.3 case/switch語(yǔ)句 67
2.8 計(jì)算機(jī)硬件對(duì)過(guò)程的支持 68
2.8.1 使用更多的寄存器 69
2.8.2 過(guò)程嵌套 71
2.8.3 在棧中為新數(shù)據(jù)分配空間 73
2.8.4 在堆中為新數(shù)據(jù)分配空間 74
2.9 人機(jī)交互 76
2.10 LEGv8中的寬立即數(shù)和地址的尋址 79
2.10.1 寬立即數(shù) 79
2.10.2 分支中的尋址 80
2.10.3 LEGv8尋址模式總結(jié) 82
2.10.4 機(jī)器語(yǔ)言解碼 82
2.11 并行與指令:同步 86
2.12 翻譯并啟動(dòng)程序 88
2.12.1 編譯器 88
2.12.2 匯編器 89
2.12.3 鏈接器 90
2.12.4 加載器 92
2.12.5 動(dòng)態(tài)鏈接庫(kù) 92
2.12.6 啟動(dòng)Java程序 94
2.13 綜合實(shí)例:C排序程序 95
2.13.1 swap過(guò)程 95
2.13.2 sort過(guò)程 97
2.14 數(shù)組和指針 101
2.14.1 用數(shù)組實(shí)現(xiàn)clear 102
2.14.2 用指針實(shí)現(xiàn)clear 102
2.14.3 比較兩個(gè)版本的clear 103
2.15 高級(jí)主題:編譯C和解釋Java 104
2.16 實(shí)例:MIPS指令集 104
2.17 實(shí)例:ARMv7(32位)指令集 105
2.18 實(shí)例:x86指令集 106
2.18.1 Intel x86的演進(jìn) 107
2.18.2 x86寄存器和數(shù)據(jù)尋址模式 108
2.18.3 x86整數(shù)操作 110
2.18.4 x86指令編碼 112
2.18.5 x86總結(jié) 112
2.19 實(shí)例:ARMv8指令集的其他部分 113
2.19.1 完整的ARMv8整數(shù)算術(shù)邏輯指令 114
2.19.2 完整的ARMv8整數(shù)數(shù)據(jù)傳輸指令 116
2.19.3 完整的ARMv8分支指令 117
2.20 謬誤與陷阱 118
2.21 本章小結(jié) 119
2.22 歷史觀點(diǎn)與拓展閱讀 121
2.23 練習(xí)題 121
第3章 計(jì)算機(jī)的算術(shù)運(yùn)算 128
3.1 引言 128
3.2 加法和減法 128
3.3 乘法 131
3.3.1 順序乘法算法及硬件 131
3.3.2 有符號(hào)乘法 134
3.3.3 更快速的乘法 134
3.3.4 LEGv8中的乘法 134
3.3.5 小結(jié) 135
3.4 除法 135
3.4.1 除法算法及硬件 135
3.4.2 有符號(hào)除法 137
3.4.3 更快速的除法 138
3.4.4 LEGv8中的除法 138
3.4.5 小結(jié) 139
3.5 浮點(diǎn)運(yùn)算 140
3.5.1 浮點(diǎn)表示 141
3.5.2 異常和中斷 142
3.5.3 IEEE 754浮點(diǎn)標(biāo)準(zhǔn) 142
3.5.4 浮點(diǎn)加法 145
3.5.5 浮點(diǎn)乘法 148
3.5.6 LEGv8中的浮點(diǎn)指令 150
3.5.7 算術(shù)精確性 154
3.5.8 小結(jié) 156
3.6 并行與計(jì)算機(jī)算術(shù):子字并行 157
3.7 實(shí)例:x86中的流處理SIMD擴(kuò)展和高級(jí)向量擴(kuò)展 158
3.8 實(shí)例:其他的ARMv8算術(shù)指令 160
3.8.1 完整的ARMv8整數(shù)和浮點(diǎn)算術(shù)指令 160
3.8.2 完整的ARMv8 SIMD指令 161
3.9 加速:子字并行和矩陣乘法 163
3.10 謬誤與陷阱 166
3.11 本章小結(jié) 168
3.12 歷史觀點(diǎn)與拓展閱讀 171
3.13 練習(xí)題 171
第4章 處理器 175
4.1 引言 175
4.1.1 一種基本的LEGv8實(shí)現(xiàn) 176
4.1.2 實(shí)現(xiàn)概述 176
4.2 邏輯設(shè)計(jì)的一般方法 178
4.3 建立數(shù)據(jù)通路 180
4.4 一種簡(jiǎn)單的實(shí)現(xiàn)機(jī)制 187
4.4.1 ALU控制 187
4.4.2 主控制單元的設(shè)計(jì) 188
4.4.3 數(shù)據(jù)通路的操作 191
4.4.4 完成控制單元 194
4.4.5 為什么不使用單周期實(shí)現(xiàn) 195
4.5 流水線概述 197
4.5.1 面向流水線的指令集設(shè)計(jì) 200
4.5.2 流水線冒險(xiǎn) 200
4.5.3 流水線概述小結(jié) 206
4.6 流水線數(shù)據(jù)通路及其控制 207
4.6.1 圖形化表示的流水線 215
4.6.2 流水線控制 218
4.7 數(shù)據(jù)冒險(xiǎn):旁路與阻塞 221
4.8 控制冒險(xiǎn) 231
4.8.1 假定分支不發(fā)生 231
4.8.2 減少分支延遲 232
4.8.3 動(dòng)態(tài)分支預(yù)測(cè) 234
4.8.4 流水線小結(jié) 236
4.9 異常 236
4.9.1 LEGv8體系結(jié)構(gòu)中的異常處理 237
4.9.2 流水線實(shí)現(xiàn)中的異常 238
4.10 指令級(jí)并行 241
4.10.1 推測(cè)的概念 242
4.10.2 靜態(tài)多發(fā)射 243
4.10.3 動(dòng)態(tài)多發(fā)射 246
4.10.4 動(dòng)態(tài)流水線調(diào)度 247
4.10.5 能耗效率與高級(jí)流水線 249
4.11 實(shí)例:ARM Cortex-A53和Intel Core i7流水線 250
4.11.1 ARM Cortex-A53 251
4.11.2 Intel Core i7 920 253
4.11.3 Intel Core i7 920的性能 255
4.12 加速:指令級(jí)并行和矩陣乘法 256
4.13 高級(jí)主題:采用硬件設(shè)計(jì)語(yǔ)言描述和建模流水線的數(shù)字設(shè)計(jì)技術(shù)以及更多流水線示例 258
4.14 謬誤與陷阱 258
4.15 本章小結(jié) 259
4.16 歷史觀點(diǎn)與拓展閱讀 260
4.17 練習(xí)題 260
第5章 大容量和高速度:開(kāi)發(fā)存儲(chǔ)器層次結(jié)構(gòu) 271
5.1 引言 271
5.2 存儲(chǔ)器技術(shù) 275
5.2.1 SRAM技術(shù) 275
5.2.2 DRAM技術(shù) 275
5.2.3 閃存 277
5.2.4 磁盤存儲(chǔ)器 277
5.3 cache的基本原理 279
5.3.1 cache訪問(wèn) 280
5.3.2 cache缺失處理 285
5.3.3 寫(xiě)操作處理 285
5.3.4 cache實(shí)例:Intrinsity FastMATH處理器 287
5.3.5 小結(jié) 289
5.4 cache性能的評(píng)估和改進(jìn) 289
5.4.1 通過(guò)更靈活的塊放置策略來(lái)減少cache缺失 292
5.4.2 在cache中查找塊 295
5.4.3 替換塊的選擇 296
5.4.4 使用多級(jí)cache減少缺失代價(jià) 297
5.4.5 通過(guò)分塊進(jìn)行軟件優(yōu)化 299
5.4.6 小結(jié) 303
5.5 可信存儲(chǔ)器層次結(jié)構(gòu) 303
5.5.1 失效的定義 303
5.5.2 糾1檢2漢明碼(SEC/DED) 305
5.6 虛擬機(jī) 308
5.6.1 虛擬機(jī)監(jiān)視器的要求 309
5.6.2 指令集體系結(jié)構(gòu)(缺乏)對(duì)虛擬機(jī)的支持 309
5.6.3 保護(hù)和指令集體系結(jié)構(gòu) 310
5.7 虛擬存儲(chǔ)器 310
5.7.1 頁(yè)的存放和查找 313
5.7.2 缺頁(yè)故障 315
5.7.3 用于大型虛擬地址的虛擬內(nèi)存 316
5.7.4 關(guān)于寫(xiě) 318
5.7.5 加快地址轉(zhuǎn)換:TLB 318
5.7.6 Intrinsity FastMATH TLB 319
5.7.7 集成虛擬存儲(chǔ)器、TLB和cache 322
5.7.8 虛擬存儲(chǔ)器中的保護(hù) 323
5.7.9 處理TLB缺失和缺頁(yè) 324
5.7.10 小結(jié) 326
5.8 存儲(chǔ)器層次結(jié)構(gòu)的一般框架 328
5.8.1 問(wèn)題1:塊放在何處 328
5.8.2 問(wèn)題2:如何找到塊 329
5.8.3 問(wèn)題3:cache缺失時(shí)替換哪一塊 330
5.8.4 問(wèn)題4:寫(xiě)操作如何處理 330
5.8.5 3C:一種理解存儲(chǔ)器層次結(jié)構(gòu)行為的直觀模型 331
5.9 使用有限狀態(tài)機(jī)控制簡(jiǎn)單的cache 332
5.9.1 一個(gè)簡(jiǎn)單的cache 333
5.9.2 有限狀態(tài)機(jī) 333
5.9.3 一個(gè)簡(jiǎn)單cache控制器的有限狀態(tài)機(jī) 335
5.10 并行與存儲(chǔ)器層次結(jié)構(gòu):cache一致性 336
5.10.1 實(shí)現(xiàn)一致性的基本方案 337
5.10.2 監(jiān)聽(tīng)協(xié)議 337
5.11 并行與存儲(chǔ)器層次結(jié)構(gòu):廉價(jià)冗余磁盤陣列 339
5.12 高級(jí)主題:實(shí)現(xiàn)cache控制器 339
5.13 實(shí)例:ARM Cortex-A53和Intel Core i7的存儲(chǔ)器層次結(jié)構(gòu) 339
5.14 實(shí)例:ARMv8系統(tǒng)的剩余部分以及特殊指令 343
5.15 加速:cache分塊和矩陣乘法 345
5.16 謬誤與陷阱 346
5.17 本章小結(jié) 349
5.18 歷史觀點(diǎn)與拓展閱讀 350
5.19 練習(xí)題 350
第6章 并行處理器:從客戶端到云 362
6.1 引言 362
6.2 創(chuàng)建并行處理程序的難點(diǎn) 364
6.3 SISD、MIMD、SIMD、SPMD和向量 367
6.3.1 x86中的SIMD:多媒體擴(kuò)展 368
6.3.2 向量 368
6.3.3 向量與標(biāo)量 370
6.3.4 向量與多媒體擴(kuò)展 370
6.4 硬件多線程 372
6.5 多核和其他共享內(nèi)存多處理器 375
6.6 圖形處理單元 378
6.6.1 NVIDIA GPU體系結(jié)構(gòu)簡(jiǎn)介 379
6.6.2 NVIDIA GPU存儲(chǔ)結(jié)構(gòu) 380
6.6.3 正確理解GPU 381
6.7 集群、倉(cāng)儲(chǔ)式計(jì)算機(jī)和其他消息傳遞多處理器 383
6.8 多處理器網(wǎng)絡(luò)拓?fù)浜?jiǎn)介 386
6.9 與外界通信:集群網(wǎng)絡(luò) 389
6.10 多處理器基準(zhǔn)測(cè)試程序和性能模型 389
6.10.1 性能模型 391
6.10.2 Roof?line模型 392
6.10.3 兩代Opteron的比較 393
6.11 實(shí)例:Intel Core i7 960
 和NVIDIA Tesla GPU的評(píng)測(cè)及Roof?line模型 396
6.12 加速:多處理器和矩陣乘法 399
6.13 謬誤與陷阱 402
6.14 本章小結(jié) 403
6.15 歷史觀點(diǎn)與拓展閱讀 405
6.16 練習(xí)題 405
附錄A 邏輯設(shè)計(jì)基礎(chǔ) 414
索引 470
網(wǎng)絡(luò)內(nèi)容
附錄B 圖形處理單元
附錄C 控制器的硬件實(shí)現(xiàn)
附錄D RISC指令集體系結(jié)構(gòu)
術(shù)語(yǔ)表
擴(kuò)展閱讀

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)