注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計Python商業(yè)數(shù)據(jù)挖掘(第6版)

Python商業(yè)數(shù)據(jù)挖掘(第6版)

Python商業(yè)數(shù)據(jù)挖掘(第6版)

定 價:¥118.00

作 者: [美] 蓋麗特·徐茉莉(Galit Shmueli) 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302590248 出版時間: 2021-11-01 包裝:
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書前5版好評如潮,作為第6版,本書首次使用了Python語言。本書除了介紹用于統(tǒng)計和機器學習等領域的預測、分類、可視化、降維、推薦系統(tǒng)、聚類、文本挖掘、網(wǎng)絡分析等方法之外,內(nèi)容還包括: ● 新加入的合著者Peter Gedeck擁有使用Python講解商業(yè)分析課程的豐富經(jīng)驗以及將機器學習應用于新藥發(fā)現(xiàn)過程的專業(yè)技能。在本書中,他十分樂于將這些經(jīng)驗和技能與讀者分享。 ● 討論數(shù)據(jù)挖掘中的倫理問題。 ● 根據(jù)教師和學生的反饋意見對內(nèi)容做了更新。 ● 通過多個案例展示數(shù)據(jù)挖掘技術的實際應用。 ● 每章后面的習題有助于讀者評估和加深對該章內(nèi)容的理解。 ● 在線支持網(wǎng)站提供了數(shù)據(jù)集、教學資料、習題答案、PPT教案和案例解決方案。

作者簡介

  Galit Shmueli博士自2004年以來,一直在美國馬里蘭大學、statistics.com統(tǒng)計網(wǎng)站、印度商學院設計并指導數(shù)據(jù)挖掘課程。Shmueli的研究領域包括信息系統(tǒng)的統(tǒng)計方法和數(shù)據(jù)挖掘,她以研究和擅長講授商業(yè)分析而聞名,并發(fā)表了100多篇文章。Peter C. Bruce是statistics.com統(tǒng)計網(wǎng)站的統(tǒng)計教育研究院的主席和創(chuàng)辦人,他發(fā)表了多篇學術論文,還開發(fā)了Resampling Stats軟件。Peter Gedeck博士是Collabrative Drug Discovery公司的高級數(shù)據(jù)科學家,他為這家公司開發(fā)了一款基于云的軟件來管理新藥發(fā)現(xiàn)過程中用到的海量數(shù)據(jù),他還在statistics.com統(tǒng)計網(wǎng)站上教授數(shù)據(jù)挖掘課程。Nitin R. Patel博士是位于馬薩諸塞州劍橋市的Cytel公司的共同創(chuàng)始人和董事,是美國統(tǒng)計協(xié)會會員,同時還是麻省理工學院和哈佛大學的客座教授。

圖書目錄

第I 部分 預備知識
第1 章 引言............................................................3
1.1 商業(yè)分析簡介...........................................3
1.2 什么是數(shù)據(jù)挖掘......................................4
1.3 數(shù)據(jù)挖掘及相關術語..............................4
1.4 大數(shù)據(jù)........................................................5
1.5 數(shù)據(jù)科學...................................................6
1.6 為什么有這么多不同的方法.................6
1.7 術語與符號...............................................7
1.8 本書的線路圖...........................................8
第2 章 數(shù)據(jù)挖掘過程概述................................11
2.1 引言..........................................................11
2.2 數(shù)據(jù)挖掘的核心思想............................11
2.2.1 分類.................................................11
2.2.2 預測.................................................12
2.2.3 關聯(lián)規(guī)則與推薦系統(tǒng)........................12
2.2.4 預測分析..........................................12
2.2.5 數(shù)據(jù)規(guī)約與降維技術........................12
2.2.6 數(shù)據(jù)探索和可視化...........................12
2.2.7 監(jiān)督學習與無監(jiān)督學習....................13
2.3 數(shù)據(jù)挖掘步驟.........................................13
2.4 前期步驟.................................................15
2.4.1 數(shù)據(jù)集的組織...................................15
2.4.2 預測West Roxbury 小區(qū)的房價........15
2.4.3 在Python 程序中載入并瀏覽數(shù)據(jù)....16
2.4.4 Python 包的導入...............................18
2.4.5 從數(shù)據(jù)庫獲得采樣數(shù)據(jù)....................18
2.4.6 在分類任務中對小概率事件的
過采樣.............................................19
2.4.7 數(shù)據(jù)預處理和數(shù)據(jù)清理....................19
2.5 預測力和過擬合.................................... 24
2.5.1 過擬合............................................. 24
2.5.2 數(shù)據(jù)分區(qū)的創(chuàng)建和使用.................... 26
2.6 建立預測模型........................................ 28
2.7 在本地計算機上用Python 實現(xiàn)
數(shù)據(jù)挖掘................................................. 32
2.8 自動化數(shù)據(jù)挖掘解決方案................... 33
2.9 數(shù)據(jù)挖掘中的倫理規(guī)范....................... 33
2.10 習題........................................................ 37
第Ⅱ部分 數(shù)據(jù)探索與降維技術
第3 章 數(shù)據(jù)可視化.............................................43
3.1 引言.......................................................... 43
3.2 數(shù)據(jù)實例................................................. 45
3.3 基本圖形:條形圖、折線圖和
散點圖..................................................... 46
3.3.1 分布圖:箱線圖和直方圖................ 48
3.3.2 熱圖:可視化相關性和缺失值......... 51
3.4 多維數(shù)據(jù)的可視化................................ 53
3.4.1 添加變量:顏色、大小、形狀、
多面板和動畫.................................. 53
3.4.2 數(shù)據(jù)操作:重定標、聚合與層次
結(jié)構(gòu)、縮放與過濾........................... 56
3.4.3 趨勢線和標簽.................................. 59
3.4.4 擴展到大型數(shù)據(jù)集........................... 60
3.4.5 多變量圖:平行坐標圖.................... 62
3.4.6 交互式可視化.................................. 63
3.5 專用的可視化技術................................ 65
3.5.1 網(wǎng)絡數(shù)據(jù)可視化............................... 65
3.5.2 層次數(shù)據(jù)可視化:樹狀結(jié)構(gòu)圖......... 66
3.5.3 地理數(shù)據(jù)可視化:地圖.................... 68
3.6 小結(jié)..........................................................71
3.7 習題..........................................................71

第11 章 神經(jīng)網(wǎng)絡............................................221
11.1 引言......................................................221
11.2 神經(jīng)網(wǎng)絡的概念和結(jié)構(gòu)...................222
11.3 在數(shù)據(jù)上擬合神經(jīng)網(wǎng)絡...................222
11.3.1 計算節(jié)點的輸出結(jié)果..................223
11.3.2 訓練模型....................................225
11.3.3 對事故的嚴重程度進行分類.......229
11.3.4 避免過擬合................................231
11.3.5 把神經(jīng)網(wǎng)絡的輸出結(jié)果用于
預測和分類................................231
11.4 要求用戶輸入.....................................231
11.5 探索預測變量與因變量的關系......232
11.6 深度學習.............................................232
11.6.1 卷積神經(jīng)網(wǎng)絡............................233
11.6.2 局部特征圖................................234
11.6.3 層次特征....................................234
11.6.4 學習過程....................................235
11.6.5 無監(jiān)督學習................................235
11.6.6 結(jié)論...........................................236
11.7 神經(jīng)網(wǎng)絡的優(yōu)缺點............................236
11.8 習題......................................................237
第12 章 判別分析............................................ 239
12.1 引言......................................................239
12.2 記錄與類別的距離...........................241
12.3 Fisher 線性分類函數(shù)........................242
12.4 判別分析的分類性能.......................245
12.5 先驗概率.............................................245
12.6 誤分類成本不均等...........................246
12.7 多類別情形下的分類.......................246
12.8 判別分析的優(yōu)缺點...........................249
12.9 習題......................................................250
第13 章 組合方法:集成學習和增益
模型.................................................... 253
13.1 集成學習.............................................253
13.1.1 為什么集成學習可以改進
預測能力...................................254
13.1.2 集成學習的優(yōu)缺點.....................257
13.2 增益(說服)模型.................................257
13.2.1 建立一個簡單的預測模型..........260
13.2.2 建立增益模型............................260
13.2.3 使用Python 程序計算增益.........261
13.2.4 應用增益模型的結(jié)果.................262
13.3 小結(jié)......................................................262
13.4 習題......................................................263
第Ⅴ部分 挖掘記錄之間的關系
第14 章 關聯(lián)規(guī)則和協(xié)同過濾...................... 267

第15 章 聚類分析............................................289
第Ⅵ部分 時間序列預測
第16 章 時間序列分析...................................313

第17 章 基于回歸的預測...............................325

第18 章 平滑法................................................349

第Ⅶ部分 數(shù)據(jù)分析

21.7 直郵捐贈.............................................416
21.7.1 背景..........................................416
21.7.2 數(shù)據(jù)..........................................416
21.7.3 任務..........................................417
21.8 產(chǎn)品目錄交叉銷售...........................417
21.8.1 背景分析...................................417
21.8.2 任務..........................................418
21.9 預測公共交通需求...........................418
21.9.1 背景分析...................................418
21.9.2 問題描述...................................418
21.9.3 數(shù)據(jù)..........................................418
21.9.4 目標..........................................419
21.9.5 任務..........................................419
21.9.6 提示和步驟................................419
附錄 Python 工具函數(shù).................................... 421

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號