注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)工業(yè)技術(shù)建筑科學(xué)建筑設(shè)計(jì)SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

定 價(jià):¥168.00

作 者: 巫銀良
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302502784 出版時(shí)間: 2018-11-01 包裝:
開本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書共27章,分為上下兩卷:上卷介紹SAS編程基礎(chǔ)與使用方法,是廣大程序員快速掌握SAS編程技術(shù)的簡(jiǎn)明開發(fā)教程;下卷闡述數(shù)據(jù)分析的關(guān)鍵基礎(chǔ)知識(shí)并提供相應(yīng)SAS代碼實(shí)現(xiàn),目的是激發(fā)讀者興趣,跨越傳統(tǒng)編程與數(shù)據(jù)分析的鴻溝,從程序員華麗轉(zhuǎn)身為數(shù)據(jù)科學(xué)家。書中演示代碼力圖簡(jiǎn)潔清晰地解釋相關(guān)概念,追求大道至簡(jiǎn)。本書兼顧編程技術(shù)與數(shù)據(jù)分析,期許程序員、信息處理與統(tǒng)計(jì)分析人員以及對(duì)數(shù)據(jù)分析科學(xué)感興趣的讀者都能從本書中獲益良多,循序漸進(jìn)地掌握數(shù)據(jù)分析的要義和精髓,從數(shù)據(jù)中獲取洞見與智慧。

作者簡(jiǎn)介

  巫銀良SAS 中國(guó)研發(fā)中心技術(shù)總監(jiān),北京大學(xué)信息科學(xué)技術(shù)學(xué)院客座教授。主要負(fù)責(zé)SAS 中國(guó)研發(fā)中心大數(shù)據(jù)與可視化分析技術(shù)、可視化數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí),商業(yè)智能和移動(dòng)應(yīng)用等產(chǎn)品線的項(xiàng)目管理。畢業(yè)于北京大學(xué),獲理學(xué)學(xué)士和碩士學(xué)位。擁有近 20 年計(jì)算機(jī)行業(yè)研發(fā)和管理經(jīng)驗(yàn),在企業(yè)應(yīng)用和商業(yè)分析領(lǐng)域有深厚的技術(shù)功底。專注于研發(fā)管理和項(xiàng)目實(shí)踐,涉及領(lǐng)域包括人工智能、大數(shù)據(jù)與可視化分析、金融量化分析與自動(dòng)交易、商業(yè)智能與互聯(lián)網(wǎng)、大型商業(yè)軟件研發(fā)管理等。

圖書目錄

上 卷

第1章 SAS語(yǔ)言入門 002

1.1 語(yǔ)言概述 005

1.2 編程環(huán)境 010

1.3 SAS Studio編程 016

第2章 數(shù)據(jù)集與DATA步 032

2.1 SAS 邏輯庫(kù) 032

2.2 SAS 數(shù)據(jù)集 036

2.3 DATA 步 041

2.3.1 內(nèi)嵌數(shù)據(jù)行或外部數(shù)據(jù)文件 043

2.3.2 通過(guò)已有 SAS 數(shù)據(jù)集生成 048

2.3.3 通過(guò) PROC IMPORT 或 PROC SQL 生成 051

2.4 DATA 步的運(yùn)行機(jī)制 054

2.4.1 編譯階段 055

2.4.2 運(yùn)行階段 056

2.5 DATA 步語(yǔ)句快速索引 057

第3章 變量與表達(dá)式 062

3.1 常量與變量 062

3.1.1 變量長(zhǎng)度與缺失值 063

3.1.2 數(shù)值常量 065

3.1.3 日期/時(shí)間/日期時(shí)間常量 067

3.1.4 字符常量 067

3.2 表達(dá)式 068

3.2.1 運(yùn)算符 068

3.2.2 運(yùn)算符優(yōu)先順序 072

3.2.3 WHERE 語(yǔ)句特定運(yùn)算符 072

3.2.4 賦值語(yǔ)句 073

3.2.5 累加賦值語(yǔ)句 074

3.2.6 RETAIN 語(yǔ)句 075



SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

3.3 SAS數(shù)組 077

3.3.1 數(shù)組名稱 079

3.3.2 數(shù)組元素變量列表 079

3.3.3 數(shù)組長(zhǎng)度 080

3.3.4 隱式下標(biāo)變量 080

3.3.5 多維數(shù)組 081

3.3.6 臨時(shí)數(shù)組 082

3.3.7 數(shù)組排序 083

3.3.8 注意事項(xiàng) 084

第4章 流程控制 087

4.1 DO-END語(yǔ)句塊 087

4.2 分支控制 088

4.2.1 IF-THEN 分支控制 088

4.2.2 ELSE-IF 多分支控制 090

4.2.3 SELECT-WHEN 多分支控制 090

4.3 循環(huán)控制 091

4.3.1 指定次數(shù)的循環(huán):DO-TO-BY 091

4.3.2 指定條件的循環(huán):DO-WHILE 與 DO-UNTIL092

4.3.3 指定集合的循環(huán):DO-OVER 093

4.4 特殊的流程控制語(yǔ)句 094

4.4.1 跳出循環(huán)語(yǔ)句:LEAVE 094

4.4.2 繼續(xù)循環(huán)語(yǔ)句:CONTINUE 094

4.4.3 返回語(yǔ)句:RETURN 095

4.4.4 中止執(zhí)行語(yǔ)句:STOP 與 ABORT 095

4.4.5 跳轉(zhuǎn)語(yǔ)句:GOTO 與 LINK 096

第 5章 函數(shù)封裝 099

5.1 LINK-RETURN 技術(shù) 101

5.2 SAS宏函數(shù)封裝 103

5.3 FCMP函數(shù) 105

5.4 系統(tǒng)函數(shù)速查 110

第6章 SAS宏 113

6.1 宏變量 114

6.1.1 命名 114

6.1.2 作用域 114

6.1.3 系統(tǒng)宏 115

6.1.4 宏代碼調(diào)試 117



目 錄

XIII

6.1.5 宏表達(dá)式 117

6.2 宏函數(shù) 119

參數(shù)定義 120

6.3 邏輯控制 121

6.3.1 宏語(yǔ)句塊 121

6.3.2 條件分支 121

6.3.3 循環(huán)控制 121

6.4 系統(tǒng)宏函數(shù) 122

第7章 DS2 124

7.1 程序結(jié)構(gòu) 126

7.1.1 變量聲明與類型 126

7.1.2 程序?qū)嶓w作用域 129

7.1.3 變量數(shù)組與標(biāo)準(zhǔn)數(shù)組 130

7.1.4 系統(tǒng)方法與用戶自定義方法 131

7.2 數(shù)據(jù)程序 136

7.3 包程序 137

7.4 線程程序 143

第8章 代碼組織 149

8.1 靜態(tài)文件包含 149

8.2 程序中動(dòng)態(tài)擴(kuò)展代碼 151

8.3 動(dòng)態(tài)執(zhí)行外部命令 153

第9章 文件讀寫 157

9.1 二進(jìn)制文件讀寫 157

9.2 文本文件讀寫 159

9.3 順序讀取多個(gè)文件 162

9.4 并行讀取多個(gè)文件 165

9.5 共享緩沖區(qū)讀寫 166

第10章 按位運(yùn)算 168

10.1 按位運(yùn)算 168

10.2 實(shí)現(xiàn)方法 169

10.3 按位運(yùn)算應(yīng)用 173

第11章 擴(kuò)展SAS功能 177

11.1 通過(guò) Module調(diào)用外部 DLL函數(shù) 177

11.2 用 C 語(yǔ)言開發(fā)用戶函數(shù)庫(kù) 182

11.2.1 準(zhǔn)備64位 C 編譯環(huán)境 182



SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

11.2.2 開發(fā)用戶自定義動(dòng)態(tài)庫(kù) 183

11.3 PROTO 編寫 C 代碼或注冊(cè)外部 DLL 184

第12章 數(shù)據(jù)結(jié)構(gòu)——數(shù)組 187

12.1 數(shù)組 187

12.1.1 DATA步數(shù)組 187

12.1.2 FCMP 數(shù)組 189

12.1.3 DS2 數(shù)組 192

12.1.4 SAS宏數(shù)組 193

12.2 數(shù)組應(yīng)用:高精度數(shù)值計(jì)算 194

第13章 數(shù)據(jù)結(jié)構(gòu)——隊(duì)列與堆棧 196

13.1 隊(duì)列 196

13.1.1 函數(shù)版實(shí)現(xiàn)與示例 196

13.1.2 宏版實(shí)現(xiàn)與示例 199

13.2 堆棧 202

函數(shù)版實(shí)現(xiàn)與示例 202

第14章 數(shù)據(jù)結(jié)構(gòu)——鏈表 206

14.1 基礎(chǔ)知識(shí) 206

14.2 如何在 SAS 代碼中內(nèi)嵌 C 語(yǔ)言代碼 207

14.3 單向鏈表和雙向鏈表 209

14.4 鏈表應(yīng)用:約瑟夫斯問(wèn)題 216

第15章 數(shù)據(jù)結(jié)構(gòu)——二叉樹 221

15.1 PROTO 實(shí)現(xiàn)與封裝 221

15.2 FCMP二叉樹實(shí)現(xiàn) 227

15.3 二叉樹應(yīng)用:算術(shù)表達(dá)式求值 231

第16章 數(shù)據(jù)結(jié)構(gòu)——矩陣運(yùn)算 235

16.1 FCMP 矩陣運(yùn)算 236

16.2 DS2 矩陣運(yùn)算 243

16.3 矩陣應(yīng)用:線性方程組求解 246

16.4 矩陣應(yīng)用:非線性方程組求解 248

第17章 數(shù)據(jù)結(jié)構(gòu)——圖 255

17.1 深度優(yōu)先和廣度優(yōu)先遍歷 256

17.2 最短路徑問(wèn)題 260

17.2.1 Dijkstra算法 261

17.2.2 Bellman-Ford 算法 263

17.2.3 Floyd-Warshall 算法 265



目 錄

下 卷

第18章 統(tǒng)計(jì)學(xué)基礎(chǔ) 270

18.1 數(shù)據(jù)特征度量 270

18.1.1 集中趨勢(shì)度量 272

18.1.2 離散趨勢(shì)度量 274

18.1.3 分布特征度量 277

18.1.4 置信區(qū)間、置信水平與 p-值 279

18.2 統(tǒng)計(jì)學(xué)上的變量類型 280

18.3 基本數(shù)據(jù)處理 283

18.3.1 排序與排名 284

18.3.2 數(shù)據(jù)轉(zhuǎn)置 285

18.3.3 堆疊與拆分 286

18.3.4 過(guò)濾數(shù)據(jù) 287

18.3.5 隨機(jī)抽樣 289

18.3.6 基本統(tǒng)計(jì)量 290

18.4 基本圖形圖表 292

18.5 SAS 產(chǎn)品與過(guò)程步概覽 303

18.5.1 SAS核心產(chǎn)品功能簡(jiǎn)介 305

18.5.2 Base SAS 過(guò)程步速查 309

18.5.3 SAS/STAT過(guò)程步速查 318

第19章 大數(shù)定律與中心極限定理 327

19.1 大數(shù)定律 327

19.1.1 弱大數(shù)定律 327

19.1.2 三種大數(shù)定律 329

19.1.3 圖形化證明 330

19.1.4 強(qiáng)大數(shù)定律 333

19.2 中心極限定理 334

19.2.1 大數(shù)定律與中心極限定理關(guān)系 335

19.2.2 圖形化證明 336

19.2.3 實(shí)際用途 340

第20章 統(tǒng)計(jì)分布 342

20.1 均勻分布 342

20.2 離散型統(tǒng)計(jì)分布 345

20.2.1 伯努利分布 345



SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

20.2.2 二項(xiàng)分布 347

20.2.3 幾何分布 353

20.2.4 負(fù)二項(xiàng)分布 357

20.2.5 超幾何分布 360

20.2.6 泊松分布 362

20.3 連續(xù)型統(tǒng)計(jì)分布 365

20.3.1 正態(tài)分布 365

20.3.2 對(duì)數(shù)正態(tài)分布 373

20.3.3 指數(shù)分布 376

20.3.4 卡方分布 379

20.3.5 學(xué)生t-分布 381

20.3.6 F分布 387

20.3.7 柯西分布 390

20.3.8 貝塔分布 392

20.3.9 伽馬分布 395

20.3.10 愛爾朗分布 397

20.3.11 韋布爾分布 399

20.3.12 三角分布 400

20.3.13 Table 分布 401

附錄:各統(tǒng)計(jì)分布之間的關(guān)系 403

第21章 方差分析 404

21.1 假設(shè)檢驗(yàn) 404

21.2 方差分析 406

21.2.1 學(xué)生t-檢驗(yàn) 406

21.2.2 單因子方差分析 408

21.2.3 雙因子方差分析 418

第22章 數(shù)據(jù)標(biāo)準(zhǔn)化 421

22.1 常用標(biāo)準(zhǔn)化方法 421

22.2 SAS數(shù)據(jù)標(biāo)準(zhǔn)化 424

22.3 自定義數(shù)據(jù)標(biāo)準(zhǔn)化 429

第23章 主成分分析與因子分析 433

23.1 主成分分析 434

23.1.1 主成分分析原理 435

23.1.2 主成分分析的具體步驟 436

23.2 因子分析 443



目 錄

23.2.1 因子分析原理 443

23.2.2 巴特利球度檢驗(yàn)和 KMO 檢驗(yàn) 443

23.2.3 因子分析的具體步驟 445

第24章 相關(guān)分析與回歸分析 450

24.1 變量關(guān)系 450

24.2 相關(guān)分析 451

24.2.1 線性相關(guān)性度量 451

24.2.2 非參數(shù)關(guān)聯(lián)度量 452

24.2.3 定量數(shù)據(jù)的相關(guān)分析 455

24.2.4 類別數(shù)據(jù)的相關(guān)分析 457

24.3 回歸分析 460

第25章 聚類分析 467

25.1 聚類度量 469

25.1.1 距離系數(shù) 469

25.1.2 相似性/相關(guān)系數(shù) 471

25.1.3 SAS實(shí)踐 473

25.2 聚類形成方法 475

25.2.1 一次形成分類系統(tǒng) 475

25.2.2 K-均值聚類 477

25.2.3 逐步形成分類系統(tǒng) 485

25.2.4 R 型聚類分析 491

25.3 自己實(shí)現(xiàn)聚類算法 494

25.3.1 K-均值方法 494

25.3.2 逐步形成分類系統(tǒng) 501

附錄:聚類度量的自定義實(shí)現(xiàn) 509

第26章 神經(jīng)網(wǎng)絡(luò) 512

26.1 神經(jīng)元模型 513

26.2 神經(jīng)網(wǎng)絡(luò) 517

26.2.1 訓(xùn)練神經(jīng)網(wǎng)絡(luò) 519

26.2.2 反向傳播算法 519

26.3 SAS 代碼實(shí)現(xiàn)與范例 524

第27 章 π高精度求解與探索分析 536

27.1 π值計(jì)算 537

27.1.1 蒙特卡羅方法 543

27.1.2 蒲豐投針?lè)椒?544



SAS技術(shù)內(nèi)幕:從程序員到數(shù)據(jù)科學(xué)家

27.1.3 微積分方法 545

27.1.4 冪級(jí)數(shù)方法 546

27.1.5 冪級(jí)數(shù)高精度方法 548

27.1.6 梅欽類公式高精度方法 550

27.1.7 迭代方法——貝拉公式 554

27.2 π值分析 557

27.2.1 數(shù)字分布規(guī)律 558

27.2.2 可視化探索 561

附錄 564

參考文獻(xiàn) 598

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)