?。鹤髡吆?jiǎn)介:胡文美(Wen-mei W. Hwu) MulticoreWare公司聯(lián)合創(chuàng)始人兼CTO,現(xiàn)任美國(guó)伊利諾伊大學(xué)厄巴納-香檳分校(UIUC)電氣與計(jì)算機(jī)工程系教授,兼任并行計(jì)算研究中心(Microsoft和Intel聯(lián)合資助)首席科學(xué)家,以及全球CUDA卓越中心(NVIDIA資助)首席研究員。胡教授是IEEE和ACM會(huì)士,在編譯器設(shè)計(jì)、計(jì)算機(jī)體系結(jié)構(gòu)、微體系結(jié)構(gòu)和并行計(jì)算方面貢獻(xiàn)卓著。:譯者簡(jiǎn)介:方娟北京工業(yè)大學(xué)計(jì)算機(jī)學(xué)院教授,計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)系主任。長(zhǎng)期從事計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域的教學(xué)和科研工作,近年來(lái)致力于異構(gòu)多核體系結(jié)構(gòu)的研究。
圖書目錄
出版者的話
譯者序
推薦序
前言
作者簡(jiǎn)介
第1章 引言 1
第2章 HSA 概述 5
2.1 GPU計(jì)算簡(jiǎn)史:HSA解決的問(wèn)題 5
2.2 HSA的支柱 9
2.2.1 HSA內(nèi)存模型 9
2.2.2 HSA排隊(duì)模型 9
2.2.3 HSAIL虛擬ISA 10
2.2.4 HSA上下文切換 10
2.3 HSA規(guī)范 10
2.3.1 HSA平臺(tái)系統(tǒng)體系結(jié)構(gòu)規(guī)范 10
2.3.2 HSA運(yùn)行時(shí)規(guī)范 10
2.3.3 HSA程序員參考手冊(cè)—HSAIL SPEC 11
2.4 HSA軟件 11
2.5 HSA基金會(huì) 12
2.6 小結(jié) 13
第3章 HSAIL——虛擬并行ISA 14
3.1 引言 14
3.2 編譯流程示例 15
3.3 HSAIL執(zhí)行模型 16
3.4 HSAIL指令集簡(jiǎn)介 17
3.4.1 原子操作 18
3.4.2 寄存器 18
3.4.3 分段 19
3.4.4 波前和通道 20
3.5 HSAIL機(jī)器模型和配置文件 21
3.6 HSAIL編譯流程 22
3.7 HSAIL編譯工具 23
3.7.1 編譯器框架 23
3.7.2 CL離線編譯 24
3.7.3 HSAIL匯編器/反匯編器 25
3.7.4 ISA和機(jī)器碼匯編器/反匯編器 25
3.8 小結(jié) 25
第4章 HSA運(yùn)行時(shí) 26
4.1 引言 26
4.2 HSA核心運(yùn)行時(shí)API 28
4.2.1 運(yùn)行時(shí)的初始化和關(guān)閉 28
4.2.2 運(yùn)行時(shí)的通知 29
4.2.3 系統(tǒng)和HSA代理信息 29
4.2.4 信號(hào) 30
4.2.5 隊(duì)列 31
4.2.6 體系結(jié)構(gòu)排隊(duì)語(yǔ)言 31
4.2.7 內(nèi)存 32
4.2.8 代碼對(duì)象和可執(zhí)行文件 34
4.3 HSA運(yùn)行時(shí)擴(kuò)展 35
4.3.1 HSAIL 終止化 35
4.3.2 圖像和采樣器 35
4.4 小結(jié) 37
參考文獻(xiàn) 38
第5章 HSA 內(nèi)存模型 39
5.1 引言 39
5.2 HSA內(nèi)存結(jié)構(gòu) 40
5.2.1 分段 41
5.2.2 平面尋址 42
5.2.3 共享虛擬尋址 42
5.2.4 所有權(quán) 43
5.2.5 圖像內(nèi)存 43
5.3 HSA內(nèi)存一致性基礎(chǔ) 43
5.3.1 背景:順序一致性 44
5.3.2 背景:沖突和競(jìng)爭(zhēng) 45
5.3.3 單一內(nèi)存范圍的HSA內(nèi)存模型 45
5.3.4 多個(gè)內(nèi)存范圍的HSA內(nèi)存模型 48
5.3.5 內(nèi)存段 51
5.3.6 匯總:HSA競(jìng)爭(zhēng)自由 51
5.3.7 附加觀察和注意事項(xiàng) 52
5.4 HSA內(nèi)存模型中的高級(jí)一致性 52
5.4.1 松弛原子 52
5.4.2 所有權(quán)和范圍界限 54
5.5 小結(jié) 54
參考文獻(xiàn) 55
第6章 HSA 排隊(duì)模型 56
6.1 引言 56
6.2 用戶模式隊(duì)列 56
6.3 體系結(jié)構(gòu)排隊(duì)語(yǔ)言 59
6.3.1 包的類型 60
6.3.2 創(chuàng)建數(shù)據(jù)包 63
6.4 包的提交與調(diào)度 64
6.5 小結(jié) 70
參考文獻(xiàn) 70
第7章 編譯器技術(shù) 71
7.1 引言 71
7.2 C++ AMP簡(jiǎn)介 71
7.2.1 C++ AMP array_view 73
7.2.2 C++ AMP parallel_for_each或內(nèi)核調(diào)用 73