注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí):SPSS Modeler案例篇

小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí):SPSS Modeler案例篇

小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí):SPSS Modeler案例篇

定 價(jià):¥79.00

作 者: 張浩彬 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787121338434 出版時(shí)間: 2018-06-01 包裝: 平裝
開(kāi)本: 16 頁(yè)數(shù): 240 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)——SPSS Modeler案例篇》用生活中常見(jiàn)的例子、有趣的插圖和通俗的語(yǔ)言,把看上去晦澀難懂的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)知識(shí)以通俗易懂的方式分享給讀者,讓讀者從入門(mén)學(xué)習(xí)階段就發(fā)現(xiàn),原來(lái)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)不但有用,還很有趣。 《小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)——SPSS Modeler案例篇》以IBM SPSS Modeler 作為案例實(shí)踐工具,首先介紹了數(shù)據(jù)挖掘的基本概念及數(shù)據(jù)挖掘方法,然后介紹了IBM SPSS Modeler 工具的基本使用、數(shù)據(jù)探索、統(tǒng)計(jì)檢驗(yàn)、回歸分析、分類(lèi)算法、聚類(lèi)算法、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)以及集成學(xué)習(xí)。每一章都會(huì)以漫畫(huà)形式介紹一些日常小例子并作為切入點(diǎn),用通俗的語(yǔ)言介紹具體的算法理論,同時(shí)在每章最后都附上應(yīng)用案例,讓讀者更輕松地閱讀《小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)——SPSS Modeler案例篇》并掌握對(duì)應(yīng)的算法和實(shí)踐操作。 《小白學(xué)數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)——SPSS Modeler案例篇》內(nèi)容循序漸進(jìn),完整覆蓋了數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的主要知識(shí)點(diǎn),適合數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)入門(mén)讀者閱讀。

作者簡(jiǎn)介

  張浩彬,數(shù)據(jù)分析/數(shù)據(jù)挖掘?qū)<遥壳叭温氂趪?guó)際商業(yè)機(jī)器(中國(guó))有限公司認(rèn)知計(jì)算部門(mén),曾張浩彬,人稱(chēng)浩彬老撕,曾任IBM大中華區(qū)商業(yè)智能事業(yè)部SPSS分析工程師,認(rèn)知解決方案事業(yè)部數(shù)據(jù)分析專(zhuān)家,現(xiàn)任廣東柯內(nèi)特環(huán)境科技有限公司首席數(shù)據(jù)科學(xué)家,致力機(jī)器學(xué)習(xí)及SPSS技術(shù)分享,專(zhuān)注于人工智能技術(shù)與應(yīng)用。

圖書(shū)目錄

第 1 章 數(shù)據(jù)挖掘那些事兒 \\ 1
1.1 當(dāng)我們?cè)谡剶?shù)據(jù)挖掘時(shí),其實(shí)在討論什么 \\ 2
1.2 從 CRISP-DM 開(kāi)啟數(shù)據(jù)挖掘?qū)嵺` \\ 7

第 2 章 數(shù)據(jù)挖掘之利器:SPSS Modeler \\ 17
2.1 SPSS Modeler 簡(jiǎn)介 \\ 18
2.2 SPSS Modeler 的下載與安裝 \\ 21
2.3 SPSS Modeler 的主界面及基本操作 \\ 23
2.3.1 SPSS Modeler 主界面介紹 \\ 23
2.3.2 鼠標(biāo)基本操作 \\ 31
2.4 將 SPSS Modeler 連接到服務(wù)器端 \\ 31

第 3 章 巧婦難為無(wú)米之炊:數(shù)據(jù),數(shù)據(jù)! \\ 34
3.1 數(shù)據(jù)的身份 \\ 35
3.1.1 變量的測(cè)量級(jí)別 \\ 35
3.1.2 變量的角色 \\ 36
3.2 數(shù)據(jù)的讀取 \\ 37
3.2.1 讀取 Excel 文件數(shù)據(jù) \\ 37
3.2.2 讀取變量文件數(shù)據(jù) \\ 38
3.2.3 讀取 SPSS Statistics(.sav)文件數(shù)據(jù) \\ 40
3.2.4 讀取數(shù)據(jù)庫(kù)數(shù)據(jù) \\ 42
3.3 數(shù)據(jù)的基本設(shè)定 \\ 45
3.3.1 變量角色的設(shè)定 \\ 45
3.3.2 字段的篩選及命名 \\ 46
3.4 數(shù)據(jù)的集成 \\ 47
3.4.1 數(shù)據(jù)的變量集成:合并節(jié)點(diǎn) \\ 47
3.4.2 數(shù)據(jù)的記錄集成:追加節(jié)點(diǎn) \\ 50

第 4 章 一點(diǎn)都不簡(jiǎn)單的描述性統(tǒng)計(jì)分析 \\ 53
4.1 分類(lèi)變量的基本分析: “矩陣”節(jié)點(diǎn) \\ 54
4.2 連續(xù)變量的基本分析:數(shù)據(jù)審核節(jié)點(diǎn) \\ 57
4.2.1 連續(xù)變量基本分析指標(biāo)介紹 \\ 57
4.2.2 “數(shù)據(jù)審核”節(jié)點(diǎn) \\ 63

第 5 章 何為足夠大的差異:常用的統(tǒng)計(jì)檢驗(yàn) \\ 67
5.1 假設(shè)檢驗(yàn) \\ 68
5.1.1 假設(shè)檢驗(yàn)的基本原理 \\ 68
5.1.2 假設(shè)檢驗(yàn)的一般步驟 \\ 69
5.2 連續(xù)變量與分類(lèi)變量之間的關(guān)系: t 檢驗(yàn) \\ 70
5.2.1 兩組獨(dú)立樣本均值比較 \\ 71
5.2.2 兩組配對(duì)樣本均值比較 \\ 72
5.2.3 使用 t 檢驗(yàn)的前提條件 \\ 73
5.2.4 案例:使用均值比較分析電信客戶(hù)的流失情況 \\ 73
5.3 兩個(gè)連續(xù)變量之間的關(guān)系:相關(guān)分析 \\ 75
5.3.1 相關(guān)分析理論 \\ 76
5.3.2 案例:使用相關(guān)分析研究居民消費(fèi)水平與國(guó)內(nèi)生產(chǎn)總值的相關(guān)關(guān)系 \\ 77
5.4 兩個(gè)分類(lèi)變量之間的關(guān)系:卡方檢驗(yàn) \\ 80
5.4.1 卡方檢驗(yàn)的原理 \\ 80
5.4.2 卡方檢驗(yàn)的前提條件 \\ 82
5.4.3 案例:使用卡方檢驗(yàn)研究?jī)蓚€(gè)分類(lèi)字段之間的關(guān)系 \\ 82

第 6 章 從身高和體重的關(guān)系談起:回歸分析 \\ 84
6.1 一元線性回歸分析 \\ 85
6.1.1 分析因變量與自變量的關(guān)系,構(gòu)建回歸模型 \\ 85
6.1.2 估計(jì)模型系數(shù),求解回歸模型 \\ 87
6.1.3 對(duì)模型系數(shù)進(jìn)行檢驗(yàn),確認(rèn)模型有效性 \\ 88
6.1.4 擬合優(yōu)度檢驗(yàn),判斷模型解釋能力 \\ 89
6.1.5 借助回歸模型進(jìn)行預(yù)測(cè) \\ 90
6.2 多元線性回歸分析 \\ 90
6.2.1 估計(jì)模型系數(shù),求解回歸模型 \\ 91
6.2.2 對(duì)模型參數(shù)進(jìn)行檢驗(yàn),確認(rèn)模型有效性 \\ 92
6.2.3 擬合優(yōu)度檢驗(yàn),判斷模型解釋能力 \\ 94
6.2.4 模型的變量選擇 \\ 95
6.3 使用線性回歸分析的注意事項(xiàng) \\ 97
6.4 案例:使用回歸分析研究影響房屋價(jià)格的重要因素 \\ 98

第 7 章 回歸豈止這么簡(jiǎn)單:回歸模型的進(jìn)一步擴(kuò)展 \\ 102
7.1 曲線回歸 \\ 103
7.2 Logistic 回歸 \\ 110
7.2.1 Logistic 回歸理論 \\ 110
7.2.2 案例:使用 Logistic 回歸模型分析個(gè)人收入水平影響因素 \\ 112

第 8 章 模型評(píng)估那些事兒:過(guò)擬合與欠擬合 \\ 117
8.1 過(guò)擬合與欠擬合 \\ 118
8.2 留出法與交叉驗(yàn)證 \\ 122
8.2.1 留出法與分層抽樣 \\ 122
8.2.2 交叉驗(yàn)證 \\ 124

第 9 章 從看電影的思考到?jīng)Q策樹(shù)的生成 \\ 126
9.1 決策樹(shù)概述 \\ 127
9.2 決策樹(shù)生成 \\ 129
9.2.1 從 ID3 算法到 C5.0 算法 \\ 131
9.2.2 CART 算法 \\ 134
9.3 決策樹(shù)的剪枝 \\ 136
9.3.1 預(yù)剪枝策略 \\ 137
9.3.2 后剪枝策略 \\ 137
9.3.3 代價(jià)敏感學(xué)習(xí) \\ 138
9.4 案例:用決策樹(shù)分析客戶(hù)違約情況 \\ 140
9.5 關(guān)于信息熵的擴(kuò)展 \\ 147

第 10 章 人工神經(jīng)網(wǎng)絡(luò):從人腦神經(jīng)元開(kāi)始 \\ 151
10.1 從人腦神經(jīng)元到人工神經(jīng)網(wǎng)絡(luò) \\ 152
10.2 感知機(jī) \\ 154
10.3 人工神經(jīng)網(wǎng)絡(luò) \\ 159
10.3.1 隱藏層的作用 \\ 159
10.3.2 人工神經(jīng)網(wǎng)絡(luò)算法 \\ 160
10.4 案例:利用人工神經(jīng)網(wǎng)絡(luò)分析某電信運(yùn)營(yíng)商的客戶(hù)流失情況 \\ 164

第 11 章 物以類(lèi)聚,人以群分:聚類(lèi)分析 \\ 172
11.1 聚類(lèi)思想的概述 \\ 173
11.2 聚類(lèi)方法的關(guān)鍵:距離 \\ 175
11.3 K-Means 算法 \\ 176
11.3.1 K-Means 算法原理 \\ 176
11.3.2 輪廓系數(shù)(Silhouette coefficient) \\ 177
11.4 案例:利用 K-Means 算法對(duì)不同型號(hào)汽車(chē)的屬性進(jìn)行聚類(lèi)分群研究 \\ 179

第 12 章 啤酒+尿布=關(guān)聯(lián)分析? \\ 186
12.1 一個(gè)關(guān)于關(guān)聯(lián)分析的傳說(shuō) \\ 187
12.2 關(guān)聯(lián)分析的基本概念 \\ 188
12.3 關(guān)聯(lián)規(guī)則的有效性指標(biāo) \\ 190
12.4 Apriori 算法 \\ 192
12.4.1 生成頻繁項(xiàng)集 \\ 193
12.4.2 生成關(guān)聯(lián)規(guī)則 \\ 195
12.5 案例:利用 Apriori 算法對(duì)顧客的個(gè)人信息及購(gòu)買(mǎi)記錄進(jìn)行關(guān)聯(lián)分析 \\ 195

第 13 章 三個(gè)臭皮匠,賽過(guò)諸葛亮:集成學(xué)習(xí)算法 \\ 199
13.1 集成學(xué)習(xí)算法概述 \\ 200
13.2 3 種不同的集成學(xué)習(xí)算法 \\ 201
13.2.1 Bagging 算法 \\ 201
13.2.2 Boosting 算法 \\ 203
13.2.3 隨機(jī)森林 \\ 204
13.3 集成學(xué)習(xí)算法實(shí)踐 \\ 205
13.3.1 Bagging 算法和 Boosting 算法 \\ 205
13.3.2 隨機(jī)森林 \\ 211
13.3.3 集成學(xué)習(xí)算法結(jié)果比較 \\ 214

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)