注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計現(xiàn)代CPU性能分析與優(yōu)化

現(xiàn)代CPU性能分析與優(yōu)化

現(xiàn)代CPU性能分析與優(yōu)化

定 價:¥99.00

作 者: [美]丹尼斯·巴赫瓦洛夫(Denis Bakhvalov) 著
出版社: 機(jī)械工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787111719489 出版時間: 2023-02-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書旨在指導(dǎo)大家優(yōu)化運(yùn)行在現(xiàn)代CPU上的應(yīng)用程序的性能。具體來說,主要分為兩部分內(nèi)容:第一部分介紹性能分析,包括對CPU微架構(gòu)、術(shù)語和指標(biāo)的簡要概述,還探討了分析性能的不同方法和現(xiàn)代平臺上可用的硬件監(jiān)控功能。第二部分展示如何發(fā)現(xiàn)優(yōu)化機(jī)會,以及可以做哪些轉(zhuǎn)換來提高程序的性能。此外,還提供了一份可應(yīng)用于用戶應(yīng)用程序的優(yōu)化清單,包括循環(huán)優(yōu)化、向量化、函數(shù)內(nèi)聯(lián)等,并討論了有助于消除CPU微架構(gòu)層面的問題(如緩存未命中、分支預(yù)測錯誤等)的代碼轉(zhuǎn)換。 本書對于從事性能關(guān)鍵型應(yīng)用程序開發(fā)和進(jìn)行系統(tǒng)底層優(yōu)化的技術(shù)人員來說是不可或缺的。對于任何想更好地了解應(yīng)用程序性能并探索其診斷和改進(jìn)方法的開發(fā)者來說,這本書也很有用。

作者簡介

  丹尼斯·巴赫瓦洛夫(Denis Bakhvalov)Intel高級開發(fā)人員,在Intel從事C 編譯器項目相關(guān)工作,致力于為不同的芯片架構(gòu)生成最佳代碼。性能工程和編譯器一直是他感興趣的研究領(lǐng)域。他于2008年開始了他的軟件開發(fā)職業(yè)生涯,參與過多個領(lǐng)域的工作,包括桌面應(yīng)用程序開發(fā)、嵌入式系統(tǒng)開發(fā)、性能分析和編譯器開發(fā)。2016年,他開設(shè)了easyperf.net博客,開始在博客中撰寫性能分析、調(diào)優(yōu)、C/C 編譯器和CPU微架構(gòu)相關(guān)的文章。譯者簡介朱金鵬榮耀終端虛擬機(jī)和編譯優(yōu)化技術(shù)負(fù)責(zé)人,有10多年安卓系統(tǒng)開發(fā)經(jīng)驗,致力于安卓手機(jī)系統(tǒng)的性能優(yōu)化。曾就職于華為終端,負(fù)責(zé)方舟編譯器關(guān)鍵特性設(shè)計與開發(fā),主導(dǎo)WebAssembly技術(shù)在輕量級操作系統(tǒng)上的應(yīng)用。他是《簡明的TensorFlow2》的合著者。 李成棟騰訊軟硬件協(xié)同架構(gòu)師,有7年性能分析優(yōu)化實踐經(jīng)驗,擅長軟硬件協(xié)同性能分析與優(yōu)化,主導(dǎo)過多款性能優(yōu)化平臺/工具的建設(shè),曾就職于阿里巴巴基礎(chǔ)軟件系統(tǒng)性能團(tuán)隊。

圖書目錄

譯者序
前言
致謝
作者簡介
第1章導(dǎo)讀1
1.1為什么需要性能調(diào)優(yōu)2
1.2誰需要做性能調(diào)優(yōu)5
1.3什么是性能分析7
1.4本書的主要內(nèi)容8
1.5本書不包含什么內(nèi)容9
1.6本章總結(jié)10
第一部分現(xiàn)代CPU性能分析
第2章性能測量12
2.1現(xiàn)代系統(tǒng)中的噪聲13
2.2生產(chǎn)環(huán)境中的性能測量15
2.3自動檢測性能退化問題16
2.4手動性能測試18
2.5軟件計時器和硬件計時器22
2.6微基準(zhǔn)測試24
2.7本章總結(jié)25
第3章CPU微架構(gòu)27
3.1指令集架構(gòu)27
3.2流水線28
3.3利用指令級并行30
3.3.1亂序執(zhí)行30
3.3.2超標(biāo)量引擎和超長指令字31
3.3.3投機(jī)執(zhí)行33
3.4利用線程級并行34
3.5存儲器層次35
3.5.1高速緩存層次35
3.5.2主存39
3.6虛擬內(nèi)存39
3.7單指令多數(shù)據(jù)多處理器40
3.8現(xiàn)代CPU設(shè)計42
3.8.1CPU前端42
3.8.2CPU后端44
3.9性能監(jiān)控單元44
第4章性能分析中的術(shù)語和指標(biāo)47
4.1退休指令與執(zhí)行指令47
4.2CPU利用率48
4.3CPI和IPC48
4.4微操作49
4.5流水線槽位51
4.6核時鐘周期和參考時鐘周期51
4.7緩存未命中52
4.8分支預(yù)測錯誤53
第5章性能分析方法55
5.1代碼插樁56
5.2跟蹤58
5.3負(fù)載表征59
5.3.1統(tǒng)計性能事件59
5.3.2手動收集性能計數(shù)60
5.3.3事件多路復(fù)用和縮放62
5.4采樣63
5.4.1用戶模式采樣和基于硬件
事件的采樣64
5.4.2尋找熱點64
5.4.3采集調(diào)用棧66
5.4.4火焰圖69
5.5屋頂線性能模型69
5.6靜態(tài)性能分析73
5.7編譯器優(yōu)化報告75
5.8本章總結(jié)78
第6章性能分析相關(guān)的CPU特性80
6.1自頂向下微架構(gòu)分析技術(shù)81
6.1.1Intel VTune Prof iler中的
            TMA84
6.1.2Linux perf中的TMA85
6.1.3第一步:確定瓶頸86
6.1.4第二步:定位具體的代碼
位置88
6.1.5第三步:解決問題90
6.1.6小結(jié)91
6.2最后分支記錄92
6.2.1采集LBR棧94
6.2.2獲取調(diào)用圖95
6.2.3識別熱點分支96
6.2.4分析分支預(yù)測錯誤率97
6.2.5機(jī)器碼的準(zhǔn)確計時98
6.2.6評估分支輸出的概率100
6.2.7其他應(yīng)用場景101
6.3基于處理器事件的采樣101
6.3.1精準(zhǔn)事件102
6.3.2降低采樣開銷103
6.3.3分析內(nèi)存訪問104
6.4Intel處理器跟蹤技術(shù)105
6.4.1工作流105
6.4.2時間報文106
6.4.3采集和解析跟蹤文件107
6.4.4用法108
6.4.5磁盤空間和解析時間109
6.5本章總結(jié)110
第二部分基于源代碼的
CPU調(diào)優(yōu)
第7章CPU前端優(yōu)化117
7.1 機(jī)器碼布局118
7.2 基本塊118
7.3 基本塊布局119
7.4 基本塊對齊121
7.5 函數(shù)拆分123
7.6 函數(shù)分組125
7.7 基于剖析文件的編譯優(yōu)化126
7.8 對ITLB的優(yōu)化128
7.9 本章總結(jié)128
第8章CPU后端優(yōu)化130
8.1 內(nèi)存綁定130
8.1.1 緩存友好的數(shù)據(jù)結(jié)構(gòu)131
8.1.2 顯式內(nèi)存預(yù)取136
8.1.3 針對DTLB優(yōu)化138
8.2 核心綁定141
8.2.1 函數(shù)內(nèi)聯(lián)141
8.2.2 循環(huán)優(yōu)化143
8.2.3 向量化149
8.3 本章總結(jié)158
第9章優(yōu)化錯誤投機(jī)160
9.1 用查表替換分支161
9.2 用斷言替換分支162
9.3 本章總結(jié)164
第10章其他調(diào)優(yōu)165
10.1 編譯時計算165
10.2 編譯器內(nèi)建函數(shù)166
10.3 緩存預(yù)熱167
10.4 減少慢速浮點運(yùn)算168
10.5 系統(tǒng)調(diào)優(yōu)169
第11章優(yōu)化多線程應(yīng)用程序171
11.1 性能擴(kuò)展和開銷171
11.2 并行效率指標(biāo)174
11.2.1 有效CPU利用率174
11.2.2 線程數(shù)量174
11.2.3 等待時間175
11.2.4 自旋時間175
11.3 使用Intel VTune Profiler進(jìn)行
分析175
11.3.1 尋找耗時鎖175
11.3.2 平臺視圖178
11.4 使用Linux perf進(jìn)行分析178
11.5 使用Coz進(jìn)行分析181
11.6 使用eBPF和GAPP進(jìn)行分析181
11.7 檢測一致性問題182
11.7.1 緩存一致性協(xié)議182
11.7.2 真共享184
11.7.3 偽共享184
11.8 本章總結(jié)186
附錄A減少測量噪聲188
附錄BLLVM向量化程序193
跋198
術(shù)語200
參考文獻(xiàn)20

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號