注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信大型網(wǎng)站運(yùn)維:從系統(tǒng)管理到SRE

大型網(wǎng)站運(yùn)維:從系統(tǒng)管理到SRE

大型網(wǎng)站運(yùn)維:從系統(tǒng)管理到SRE

定 價(jià):¥102.00

作 者: 顧賢杰,徐赟,顏中冠 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787121416125 出版時(shí)間: 2021-08-01 包裝: 平裝
開本: 16開 頁數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡介

  運(yùn)維發(fā)展到現(xiàn)在,與最初相比發(fā)生了巨大的變化。10多年的互聯(lián)網(wǎng)發(fā)展,讓國內(nèi)的運(yùn)維經(jīng)歷了快速的變革,開始和國外接軌,甚至在部分場景有單獨(dú)的演化。DevOps和SRE作為運(yùn)維領(lǐng)域的兩個(gè)演化方向,在最近幾年獲得了很多關(guān)注,也有很多公司進(jìn)行了相關(guān)的實(shí)踐。與DevOps遍地開花的情況相比,SRE在國內(nèi)的發(fā)展稍顯低調(diào)?!禨RE:Google運(yùn)維解密》一書對國內(nèi)外運(yùn)維領(lǐng)域有很大沖擊。本書作者作為一直工作在一線的運(yùn)維工程師,理所當(dāng)然地對SRE相關(guān)理念進(jìn)行了實(shí)踐,本書可以說是對SRE領(lǐng)域階段性的實(shí)踐總結(jié)。 本書主要對傳統(tǒng)運(yùn)維和SRE進(jìn)行不同對比,讓大家了解運(yùn)維工程師在實(shí)踐SRE理念時(shí),關(guān)注的點(diǎn)和具體的實(shí)踐經(jīng)驗(yàn)。本書的前半部分更多地注重SRE在實(shí)際工作中對融入開發(fā)團(tuán)隊(duì)、監(jiān)控建設(shè)、變更管理、容量管理、異常響應(yīng)、穩(wěn)定性治理、事故復(fù)盤、用戶體驗(yàn)管理等方面的實(shí)踐和落地。 在對SRE的工作有了一定了解后,本書會(huì)針對重要業(yè)務(wù)保障場景進(jìn)行實(shí)戰(zhàn)講解。本書最后部分對SRE工作中涉及的一些技術(shù)進(jìn)行了概述,以便有興趣的同學(xué)了解SRE相關(guān)的技術(shù)點(diǎn)。

作者簡介

  顧賢杰 網(wǎng)易運(yùn)維專家、SRE團(tuán)隊(duì)Leader,10多年來一直聚焦互聯(lián)網(wǎng)業(yè)務(wù)運(yùn)維和穩(wěn)定性建設(shè)。在互聯(lián)網(wǎng)業(yè)務(wù)運(yùn)維方面經(jīng)驗(yàn)豐富,曾負(fù)責(zé)網(wǎng)易博客、相冊、即時(shí)通信、支付、電商、賬號系統(tǒng)、云音樂等眾多產(chǎn)品的運(yùn)維工作。在金融支付機(jī)房設(shè)計(jì)、高性能負(fù)載均衡建設(shè)、業(yè)務(wù)雙機(jī)房改造部署、災(zāi)備建設(shè)等多個(gè)運(yùn)維領(lǐng)域均有實(shí)踐,設(shè)計(jì)過海量服務(wù)器運(yùn)維工具平臺,負(fù)責(zé)的產(chǎn)品服務(wù)了上億的互聯(lián)網(wǎng)用戶。 目前的運(yùn)維研究方向:海量服務(wù)器穩(wěn)定性治理、基礎(chǔ)設(shè)施即代碼、混合云/云原生體系下的運(yùn)維平臺建設(shè)。徐赟 網(wǎng)易資深運(yùn)維開發(fā)工程師,運(yùn)維開發(fā)團(tuán)隊(duì)技術(shù)Leader。參與并主導(dǎo)杭研運(yùn)維體系建設(shè),包括監(jiān)控、流程、發(fā)布、審批等運(yùn)維領(lǐng)域。持續(xù)探索運(yùn)維自動(dòng)化、智能化、一體化建設(shè),為網(wǎng)易云音樂、網(wǎng)易傳媒、網(wǎng)易支付等上百個(gè)產(chǎn)品提供高效穩(wěn)定的運(yùn)維服務(wù)。顏中冠 網(wǎng)易技術(shù)經(jīng)理、資深架構(gòu)師,有16年的互聯(lián)網(wǎng)一線研發(fā)和架構(gòu)經(jīng)驗(yàn)。曾負(fù)責(zé)億級統(tǒng)一認(rèn)證項(xiàng)目,主持網(wǎng)易帳號異地雙機(jī)房建設(shè),以及網(wǎng)易云計(jì)算業(yè)務(wù)中臺搭建,負(fù)責(zé)多個(gè)對外億級商業(yè)化項(xiàng)目研發(fā)。

圖書目錄

第1章 關(guān)于SRE 1
1.1 為什么會(huì)引入SRE 2
1.2 DevOps和SRE對比 5
1.2.1 DevOps的發(fā)展 5
1.2.2 SRE的發(fā)展 6
1.3 選擇SRE 8
1.4 SRE的未來 9
第2章 SRE在組織內(nèi)部的定位 11
2.1 如何介入組織 12
2.2 SRE工作著力點(diǎn) 16
2.3 如何衡量工作 19
2.4 貢獻(xiàn)價(jià)值 22
第3章 監(jiān)控建設(shè) 25
3.1 什么是好的監(jiān)控服務(wù) 25
3.1.1 穩(wěn)定 25
3.1.2 準(zhǔn)確 27
3.1.3 易用 29
3.2 監(jiān)控系統(tǒng)的設(shè)計(jì)邏輯分析 29
3.2.1 數(shù)據(jù)生產(chǎn) 30
3.2.2 數(shù)據(jù)上報(bào) 31
3.2.3 數(shù)據(jù)處理 33
3.2.4 數(shù)據(jù)存儲 34
3.2.5 數(shù)據(jù)使用 36
3.3 典型監(jiān)控應(yīng)用場景 41
3.3.1 系統(tǒng)監(jiān)控 41
3.3.2 應(yīng)用監(jiān)控 42
3.3.3 終端監(jiān)控 44
3.3.4 秒級監(jiān)控 45
3.3.5 監(jiān)控大盤 46
3.3.6 鏈路監(jiān)控 46
3.4 報(bào)警治理 47
3.5 容器監(jiān)控 50
3.6 監(jiān)控智能化 51
第4章 變更管理 53
4.1 變更管理機(jī)制 54
4.1.1 傳統(tǒng)運(yùn)維的變更管理 55
4.1.2 DevOps的變更管理 57
4.1.3 SRE的變更管理 59
4.1.4 變更管理實(shí)踐總結(jié) 61
4.2 變更控制 62
4.2.1 如何建設(shè)好的變更控制 62
4.2.2 制定符合業(yè)務(wù)需求的變更控制機(jī)制 64
4.3 穩(wěn)定性和迭代速度的權(quán)衡 66
4.4 變更風(fēng)險(xiǎn)控制 68
4.5 總結(jié) 70
第5章 異常響應(yīng) 71
5.1 異常的定義 71
5.2 事故/事件定義 73
5.2.1 區(qū)分事件和事故 73
5.2.2 事故等級制度 74
5.3 異常響應(yīng)流程 76
5.4 如何處理值班過程中的異常響應(yīng) 79
5.5 應(yīng)急溝通機(jī)制 82
5.6 關(guān)于線上問題的ROC 84
第6章 服務(wù)穩(wěn)定性治理 88
6.1 SLI/SLO/SLA的制定和落地 88
6.1.1 SLI的制定和應(yīng)用 89
6.1.2 SLO的計(jì)算和應(yīng)用 90
6.1.3 SLA的計(jì)算和應(yīng)用 91
6.2 故障預(yù)防 92
6.3 抑制不可控因素 95
6.4 故障演練 97
6.4.1 故障梳理 97
6.4.2 故障預(yù)案 98
6.4.3 混濁工程 98
6.5 故障自愈 100
6.6 業(yè)務(wù)MTTR 102
6.6.1 關(guān)于故障修復(fù)MTTR 102
6.6.2 關(guān)于故障解決MTTR 104
6.7 災(zāi)備建設(shè) 105
6.8 總結(jié) 109
第7章 事故復(fù)盤 110
7.1 關(guān)于事故復(fù)盤 112
7.1.1 事故復(fù)盤初級階段 112
7.1.2 事故復(fù)盤中級階段 113
7.1.3 事故復(fù)盤成熟階段 113
7.2 如何提升事故復(fù)盤質(zhì)量 115
7.2.1 事故復(fù)盤深度 116
7.2.2 事故復(fù)盤報(bào)告 118
7.3 事故分析的邏輯和原則 119
7.4 事故責(zé)任的劃分邏輯 123
7.5 事后跟進(jìn) 126
7.6 基于事故/事件的學(xué)習(xí) 128
第8章 容量管理 131
8.1 容量管理的目標(biāo) 131
8.2 容量管理的方法和策略 132
8.2.1 傳統(tǒng)評估方法 133
8.2.2 IT資源成本的構(gòu)成 133
8.2.3 容量水位的定義 134
8.2.4 容量管理策略 137
8.3 容量分析系統(tǒng)建設(shè) 137
8.3.1 業(yè)務(wù)負(fù)載平臺 137
8.3.2 巡檢管理平臺 139
8.3.3 監(jiān)控系統(tǒng)和CMDB系統(tǒng) 142
8.4 容量優(yōu)化方式 143
8.4.1 業(yè)務(wù)容量優(yōu)化 143
8.4.2 資源容量優(yōu)化 143
8.4.3 架構(gòu)容量優(yōu)化 146
8.5 容量預(yù)案 151
8.6 總結(jié) 153
第9章 用戶體驗(yàn) 154
9.1 外部用戶體驗(yàn)和內(nèi)部用戶體驗(yàn) 155
9.1.1 外部用戶體驗(yàn) 156
9.1.2 內(nèi)部用戶體驗(yàn) 158
9.2 影響用戶體驗(yàn)的要素 159
9.3 外部用戶體驗(yàn)的改進(jìn)策略 162
9.4 內(nèi)部用戶體驗(yàn)的改進(jìn)策略 165
9.4.1 數(shù)據(jù)兼容性 165
9.4.2 工作流程 167
9.4.3 執(zhí)行效率 169
第10章 重要業(yè)務(wù)活動(dòng)保障 172
10.1 重要業(yè)務(wù)活動(dòng)的資源準(zhǔn)備 173
10.1.1 容量規(guī)劃 173
10.1.2 資源交付規(guī)劃 175
10.1.3 技術(shù)優(yōu)化 178
10.2 參與運(yùn)營活動(dòng)評估 181
10.3 重要業(yè)務(wù)活動(dòng)穩(wěn)定性預(yù)案 184
10.4 重要業(yè)務(wù)活動(dòng)準(zhǔn)備階段的工作重點(diǎn) 187
10.5 重要業(yè)務(wù)活動(dòng)的變更執(zhí)行要求 190
10.6 重要業(yè)務(wù)活動(dòng)的運(yùn)維人力 192
10.7 重要業(yè)務(wù)活動(dòng)的收尾 193
第11章 運(yùn)維操作基礎(chǔ) 196
11.1 網(wǎng)絡(luò)基礎(chǔ) 197
11.1.1 ARP 197
11.1.2 路由 200
11.2 4/7層協(xié)議 204
11.2.1 4層協(xié)議 204
11.2.2 7層協(xié)議 208
11.3 內(nèi)核參數(shù)調(diào)優(yōu) 213
11.3.1 TCP網(wǎng)絡(luò)堆棧內(nèi)存 214
11.3.2 TCP連接數(shù)優(yōu)化 215
11.3.3 TCP高并發(fā)優(yōu)化 216
11.3.4 網(wǎng)絡(luò)參數(shù)額外調(diào)整項(xiàng) 217
11.3.5 TCP擁堵算法 218
11.4 常見命令行 221
11.4.1 查看數(shù)據(jù)指標(biāo) 222
11.4.2 網(wǎng)絡(luò)數(shù)據(jù)包分析 223
11.5 配置管理工具 227
11.5.1 Ansible 228
11.5.2 CFEngine 229
11.5.3 Chef 231
11.5.4 Puppet 234
11.5.5 Salt 237
11.5.6 配置管理工具的匯總說明 240
11.5.7 云環(huán)境下的配置管理工具演化 241
11.6 基礎(chǔ)設(shè)施即代碼 242
11.7 關(guān)于運(yùn)維操作的未來 244
第12章 基礎(chǔ)組件運(yùn)維 245
12.1 負(fù)載均衡中間件 245
12.1.1 算法邏輯的影響 246
12.1.2 附加特性的作用 252
12.1.3 負(fù)載均衡方案 254
12.1.4 負(fù)載均衡總結(jié) 256
12.2 消息隊(duì)列中間件 258
12.2.1 消息隊(duì)列方案的技術(shù)決策 259
12.2.2 消息隊(duì)列的技術(shù)演化 261
12.3 緩存中間件 262
12.3.1 緩存中間件的技術(shù)關(guān)注點(diǎn) 263
12.3.2 緩存中間件的選型策略 265
12.3.3 緩存中間件的技術(shù)演化 270
12.4 數(shù)據(jù)庫 272
12.4.1 SQL數(shù)據(jù)庫技術(shù)的選擇 273
12.4.2 SQL數(shù)據(jù)庫的配置注意事項(xiàng) 276
12.4.3 NoSQL數(shù)據(jù)庫技術(shù)的選擇 279
12.4.4 時(shí)序數(shù)據(jù)庫技術(shù) 282
12.5 組件運(yùn)維 283
第13章 云計(jì)算和容器 284
13.1 云計(jì)算基礎(chǔ) 285
13.1.1 云計(jì)算平臺運(yùn)維 286
13.1.2 云計(jì)算平臺上的產(chǎn)品運(yùn)維 288
13.2 虛擬化 290
13.3 容器 292
13.4 云存儲 296
13.5 云網(wǎng)絡(luò) 299
13.6 混合云 302
13.7 云原生 305
13.7.1 云原生的需求情況 305
13.7.2 云原生的發(fā)展 307
13.7.3 云原生的展望 309


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號