注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)

定 價(jià):¥79.00

作 者: 鄧立國(guó)
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302577874 出版時(shí)間: 2021-05-01 包裝: 平裝-膠訂
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 297 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)涵蓋數(shù)據(jù)分析與數(shù)據(jù)挖掘的基礎(chǔ)知識(shí)、工具和有效實(shí)踐方法,能讓讀者充分掌握數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本技能。 本書(shū)共分為15章,主要內(nèi)容包括大數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、探索性數(shù)據(jù)分析、用Sklearn估計(jì)器分類(lèi)、主流數(shù)據(jù)分析庫(kù)、大數(shù)據(jù)的數(shù)據(jù)庫(kù)類(lèi)型、數(shù)據(jù)倉(cāng)庫(kù)/商業(yè)智能、數(shù)據(jù)聚合與分組運(yùn)算、數(shù)據(jù)挖掘工具、挖掘建模、模型評(píng)估、社會(huì)媒體挖掘、圖挖掘分類(lèi)、基于深度學(xué)習(xí)的驗(yàn)證碼識(shí)別、基于深度學(xué)習(xí)的文本分類(lèi)挖掘?qū)崿F(xiàn)。 本書(shū)采用理論與實(shí)踐相結(jié)合的方式,利用Python語(yǔ)言的強(qiáng)大功能,以*小的編程代價(jià)進(jìn)行數(shù)據(jù)的提取、處理、分析和挖掘,既適合Python數(shù)據(jù)分析與數(shù)據(jù)挖掘初學(xué)者、大數(shù)據(jù)從業(yè)人員閱讀,也適合高等院校和培訓(xùn)機(jī)構(gòu)大數(shù)據(jù)與人工智能相關(guān)專(zhuān)業(yè)的師生教學(xué)參考。

作者簡(jiǎn)介

  鄧立國(guó),東北大學(xué)計(jì)算機(jī)應(yīng)用博士畢業(yè)。2005年開(kāi)始在沈陽(yáng)師范大學(xué)軟件學(xué)院、教育技術(shù)學(xué)院任教,主要研究方向:數(shù)據(jù)挖掘、知識(shí)工程、大數(shù)據(jù)處理、云計(jì)算、分布式計(jì)算等。以作者發(fā)表學(xué)術(shù)論文30多篇(26篇EI),主編教材 1 部,主持科研課題6項(xiàng),經(jīng)費(fèi)10余萬(wàn)元,多次獲得校級(jí)科研優(yōu)秀獎(jiǎng),作為九三社員提出的智慧城市提案被市政府采納,研究成果被教育廳等單位采用。

圖書(shū)目錄

第1章  大數(shù)據(jù)采集 1
1.1  大數(shù)據(jù)分類(lèi) 1
1.2  大數(shù)據(jù)采集方法 2
1.3  Python爬蟲(chóng) 3
1.3.1  審查元素 4
1.3.2  認(rèn)識(shí)網(wǎng)頁(yè)結(jié)構(gòu) 5
1.3.3  認(rèn)識(shí)robots.txt的文檔 6
1.3.4  爬蟲(chóng)的基本原理 11
1.3.5  Python爬蟲(chóng)架構(gòu) 11
1.3.6  用GET方式抓取數(shù)據(jù) 12
1.3.7  用POST方式抓取數(shù)據(jù) 15
1.3.8  用Beautiful Soup解析網(wǎng)頁(yè) 17
1.3.9  Python爬蟲(chóng)案例 19
1.4  本章小結(jié) 25
第2章  數(shù)據(jù)預(yù)處理 26
2.1  數(shù)據(jù)清洗 26
2.1.1  缺失值處理 27
2.1.2  異常值處理 28
2.2  數(shù)據(jù)集成 30
2.3  數(shù)據(jù)轉(zhuǎn)換 32
2.4  數(shù)據(jù)規(guī)約 34
2.5  Python主要數(shù)據(jù)預(yù)處理函數(shù) 35
2.6  本章小結(jié) 37
第3章  探索性數(shù)據(jù)分析 38
3.1  異常值分析 38
3.2  缺失值分析 41
3.3  分布分析 43
3.4  相關(guān)性分析 46
3.5  對(duì)比分析 48
3.6  統(tǒng)計(jì)量分析 48
3.7  周期性分析 51
3.8  貢獻(xiàn)度分析 51
3.9  Python主要數(shù)據(jù)探索函數(shù) 52
3.10  本章小結(jié) 53
第4章  Sklearn估計(jì)器 54
4.1  Sklearn概述 54
4.2  使用Sklearn估計(jì)器分類(lèi) 58
4.2.1  k近鄰算法 59
4.2.2  管道機(jī)制 63
4.2.3  Sklearn比較分類(lèi)器 65
4.3  本章小結(jié) 69
第5章  主流數(shù)據(jù)分析庫(kù) 70
5.1  NumPy 70
5.2  Pandas 75
5.2.1  Pandas系列 76
5.2.2  Pandas數(shù)據(jù)幀 78
5.2.3  Pandas面板 84
5.3  SciPy 86
5.4  Matplotlib 90
5.5  本章小結(jié) 93
第6章  大數(shù)據(jù):數(shù)據(jù)庫(kù)類(lèi)型 94
6.1  關(guān)系型數(shù)據(jù)庫(kù) 94
6.2  關(guān)系型數(shù)據(jù)庫(kù)與非關(guān)系型數(shù)據(jù)庫(kù)的關(guān)系 95
6.3  SQLite 96
6.3.1  SQLite安裝與配置 96
6.3.2  SQLite命令 97
6.3.3  SQLite語(yǔ)法 99
6.3.4  SQLite - Python 104
6.4  MySQL 111
6.4.1  MySQL安裝 111
6.4.2  MySQL管理 114
6.4.3  MySQL PHP語(yǔ)法 116
6.4.4  PHP腳本連接MySQL 116
6.4.5  Python操作MySQL數(shù)據(jù)庫(kù) 117
6.5  NoSQL數(shù)據(jù)庫(kù) 123
6.5.1  NoSQL概述 123
6.5.2  列存儲(chǔ)數(shù)據(jù)庫(kù) 125
6.5.3  文檔存儲(chǔ)數(shù)據(jù)庫(kù) 134
6.5.4  鍵值存儲(chǔ)數(shù)據(jù)庫(kù) 143
6.5.5  圖存儲(chǔ)數(shù)據(jù)庫(kù) 153
6.5.6  對(duì)象存儲(chǔ)數(shù)據(jù)庫(kù) 155
6.5.7  XML數(shù)據(jù)庫(kù) 155
6.6  本章小結(jié) 157
第7章  數(shù)據(jù)倉(cāng)庫(kù)/商業(yè)智能 158
7.1  數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能簡(jiǎn)介 158
7.2  數(shù)據(jù)倉(cāng)庫(kù)架構(gòu) 159
7.3  OLAP 160
7.4  數(shù)據(jù)集市 161
7.5  商業(yè)智能 162
7.6  本章小結(jié) 163
第8章  數(shù)據(jù)聚合與分組運(yùn)算 164
8.1  GroupBy技術(shù) 164
8.1.1  通過(guò)函數(shù)進(jìn)行分組 165
8.1.2  對(duì)分組進(jìn)行迭代 167
8.1.3  選取一個(gè)或一組列 170
8.1.4  通過(guò)字典或Series進(jìn)行分組 171
8.1.5  通過(guò)函數(shù)進(jìn)行分組 172
8.1.6  根據(jù)索引級(jí)別分組 173
8.2  數(shù)據(jù)聚合 174
8.2.1  面向列的多函數(shù)應(yīng)用 174
8.2.2  以無(wú)索引的方式返回聚合數(shù)據(jù) 177
8.2.3  分組級(jí)運(yùn)算和轉(zhuǎn)換 178
8.3  透視表和交叉表 181
8.4  本章小結(jié) 183
第9章  數(shù)據(jù)挖掘工具 184
9.1  數(shù)據(jù)挖掘工具分類(lèi) 184
9.2  數(shù)據(jù)挖掘經(jīng)典算法 185
9.3  免費(fèi)數(shù)據(jù)挖掘工具 186
9.4  Git和GitHub項(xiàng)目數(shù)據(jù)挖掘工具 188
9.5  Python數(shù)據(jù)挖掘工具 190
9.5.1  Gensim 190
9.5.2  TensorFlow 194
9.5.3  Keras 197
9.6  本章小結(jié) 197
第10章  挖掘建模 198
10.1  數(shù)據(jù)挖掘建模的一般過(guò)程 198
10.2  分類(lèi)與預(yù)測(cè) 199
10.3  聚類(lèi)分析 200
10.4  關(guān)聯(lián)分析 201
10.5  時(shí)序模式 202
10.6  離群點(diǎn)檢測(cè) 203
10.7  本章小結(jié) 204
第11章  模型評(píng)估 205
11.1  驗(yàn)證 205
11.2  交叉驗(yàn)證 206
11.3  自助法 206
11.4  回歸評(píng)估指標(biāo) 207
11.5  分類(lèi)評(píng)估指標(biāo) 207
11.6  ROC曲線(xiàn) 208
11.7  本章小結(jié) 210
第12章  社會(huì)媒體挖掘 211
12.1  社會(huì)媒體與社會(huì)媒體數(shù)據(jù) 211
12.2  中國(guó)社會(huì)媒體核心用戶(hù)數(shù)據(jù)分析 212
12.3  社會(huì)媒體挖掘技術(shù)與研究熱點(diǎn) 213
12.4  社會(huì)媒體挖掘流程 214
12.5  Twitter情感分析 216
12.6  本章小結(jié) 221
第13章  圖挖掘分類(lèi) 222
13.1  圖挖掘概述 222
13.2  圖挖掘技術(shù)基礎(chǔ) 224
13.3  網(wǎng)絡(luò)度量 226
13.4  網(wǎng)絡(luò)模型 229
13.5  圖挖掘與知識(shí)推理 230
13.6  圖挖掘算法簡(jiǎn)介 231
13.7  社區(qū)檢測(cè) 232
13.7.1  模塊度 233
13.7.2  社區(qū)發(fā)現(xiàn)算法 234
13.8  頻繁子圖挖掘算法gSpan的實(shí)現(xiàn) 237
13.9  基于networkx進(jìn)行社交網(wǎng)絡(luò)分析 239
13.10  本章小結(jié) 245
第14章  基于深度學(xué)習(xí)的驗(yàn)證碼識(shí)別 246
14.1  獲取圖片驗(yàn)證碼 246
14.2  驗(yàn)證碼圖片預(yù)處理 248
14.3  依賴(lài)TensorFlow的深度學(xué)習(xí)驗(yàn)證碼識(shí)別 255
14.4  本章小結(jié) 259
第15章  基于深度學(xué)習(xí)的文本分類(lèi)挖掘?qū)崿F(xiàn) 260
15.1  文本分類(lèi)概念 260
15.2  文本分類(lèi)挖掘算法概述 261
15.3  基于傳統(tǒng)機(jī)器學(xué)習(xí)的文本分類(lèi) 262
15.4  基于深度學(xué)習(xí)的文本分類(lèi) 263
15.4.1  FastText文本分類(lèi)模型算法實(shí)現(xiàn) 264
15.4.2  TextCNN文本分類(lèi)模型算法實(shí)現(xiàn) 268
15.4.3  Bert深度雙向Transformer構(gòu)建語(yǔ)言理解預(yù)訓(xùn)練模型 271
15.4.4  TextRNN文本分類(lèi) 273
15.4.5  RCNN文本分類(lèi) 275
15.4.6  Hierarchical Attention Network文本分類(lèi) 278
15.4.7  seq2seq with attention文本分類(lèi) 281
15.4.8  Transformer文本分類(lèi) 283
15.4.9  Dynamic Memory Network文本分類(lèi) 289
15.4.10  Recurrent Entity Network文本分類(lèi) 292
15.4.11  Boosting文本分類(lèi) 294
15.4.12  BiLstmTextRelation文本分析 294
15.4.13  twoCNNTextRelation文本分類(lèi) 297
15.5  本章小結(jié) 297
參考文獻(xiàn) 298

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)