注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python預(yù)測分析與機(jī)器學(xué)習(xí)

Python預(yù)測分析與機(jī)器學(xué)習(xí)

Python預(yù)測分析與機(jī)器學(xué)習(xí)

定 價(jià):¥89.00

作 者: 王沁晨
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302592549 出版時(shí)間: 2022-05-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書從理解問題定義、了解數(shù)據(jù)內(nèi)的高層信息、數(shù)據(jù)清理、視化數(shù)據(jù),到基礎(chǔ)建模、模型優(yōu)化,分享一個(gè)數(shù)據(jù)分析師的視角與思路。在預(yù)測分析的流程中,一步步用詳細(xì)的圖文代碼講解使用到的庫,如何正確使用各個(gè)庫中的方法和函數(shù),以及在遇到類似的問題時(shí)如何套用學(xué)過的知識(shí)。 本書共8章。第1章對(duì)預(yù)測分析的流程進(jìn)行一個(gè)高層次的概述。第2章介紹本書需要安裝使用的庫,并講解數(shù)據(jù)清理步驟的執(zhí)行。第3章講解基礎(chǔ)建模需考慮的細(xì)節(jié),結(jié)合第4章的模型選擇,可以搭建一個(gè)基礎(chǔ)的預(yù)測管道。第5章和第6章分別從模型和數(shù)據(jù)的角度講解如何優(yōu)化預(yù)測表現(xiàn)。第7章講解時(shí)間序列這一特殊數(shù)據(jù)的預(yù)測方法。后,第8章總結(jié)全書學(xué)習(xí)到的內(nèi)容,解決一個(gè)實(shí)戰(zhàn)問題。 本書面向3類讀者。第1類,有編程基礎(chǔ)但毫無數(shù)據(jù)科學(xué)背景,有意入門的讀者;第2類,有數(shù)據(jù)科學(xué)理論基礎(chǔ),有意進(jìn)入實(shí)操的讀者,如剛畢業(yè)沒有業(yè)界經(jīng)驗(yàn)的學(xué)生;第3類,有數(shù)據(jù)科學(xué)理論基礎(chǔ)與實(shí)操經(jīng)驗(yàn),但日常工作集中在數(shù)據(jù)分析管道中的數(shù)據(jù)分析師。

作者簡介

  王沁晨,多倫多大學(xué)圣喬治校區(qū)計(jì)算機(jī)專業(yè),曾在加拿大零售企業(yè)Loblaw Companies擔(dān)任機(jī)器學(xué)習(xí)數(shù)據(jù)分析師,從公司傳統(tǒng)的大型數(shù)據(jù)庫中篩選有效信息、清理數(shù)據(jù)、人工數(shù)據(jù)挖掘、視化,到基礎(chǔ)建模、模型優(yōu)化、數(shù)據(jù)再篩選,再到結(jié)合商業(yè)需求創(chuàng)造擴(kuò)展性強(qiáng)的實(shí)用管線,讓項(xiàng)目從理論性的頭腦風(fēng)暴變現(xiàn)為商業(yè)價(jià)值。

圖書目錄

第1章預(yù)測分析與機(jī)器學(xué)習(xí)的實(shí)用價(jià)值
1.1人工智能、機(jī)器學(xué)習(xí)與數(shù)據(jù)分析的關(guān)系
1.2什么是預(yù)測分析
1.3預(yù)測分析在各行業(yè)中的應(yīng)用
1.4預(yù)測分析流程概覽
1.5小結(jié)
第2章數(shù)據(jù)清理
2.1建立編程環(huán)境
2.1.1Anaconda簡介及安裝
2.1.2Jupyter Notebook 簡介及安裝
2.1.3Pandas簡介及安裝
2.1.4scikitlearn 簡介及安裝
2.1.5XGBoost、LightGBM、CatBoost簡介及安裝
2.1.6TensorFlow簡介及安裝
2.2面對(duì)異構(gòu)數(shù)據(jù)如何下手
2.2.1什么是異構(gòu)數(shù)據(jù)
2.2.2如何處理異構(gòu)數(shù)據(jù)
2.3數(shù)據(jù)誤差
2.3.1各類數(shù)據(jù)誤差及其影響
2.3.2如何處理數(shù)據(jù)誤差
2.4數(shù)據(jù)重新格式化
第3章基礎(chǔ)建模
3.1判斷何為X和y
3.1.1X和y的定義
3.1.2X和y的選擇對(duì)預(yù)測的影響
3.2訓(xùn)練集、驗(yàn)證集與測試集
3.2.1三者的定義及關(guān)系
3.2.2如何使用sklearn分離3個(gè)集
3.2.3如何使用Pandas手動(dòng)分離3個(gè)集
3.3數(shù)據(jù)泄露
3.3.1不同類型的數(shù)據(jù)泄露
3.3.2發(fā)現(xiàn)并避免目標(biāo)泄露
3.3.3避免訓(xùn)練集與測試集的相互污染
3.4偏差與方差
3.4.1定義偏差與方差
3.4.2過擬合與欠擬合
3.4.3實(shí)踐中的過擬合與欠擬合
3.5小結(jié)
 
 
第4章模型選擇
4.1樸素貝葉斯分類器
4.2關(guān)聯(lián)規(guī)則算法
4.3K近鄰算法
4.4K均值聚類算法
4.5回歸算法
4.5.1線性回歸
4.5.2羅吉斯蒂回歸
4.6深度神經(jīng)網(wǎng)絡(luò)
4.7決策樹
4.8森林算法
4.8.1隨機(jī)森林
4.8.2隨機(jī)樹
4.8.3孤立森林
4.9提升方法
4.9.1Adaboost
4.9.2XGBoost和LightGBM
4.9.3CatBoost
第5章模型優(yōu)化
5.1損失函數(shù)和衡量指標(biāo) 
5.1.1分類問題的衡量指標(biāo)
5.1.2回歸問題的衡量指標(biāo)
5.1.3損失函數(shù)
5.2K折交叉驗(yàn)證
5.3超參數(shù)調(diào)試
5.3.1網(wǎng)格搜索法
5.3.2隨機(jī)搜索法
5.3.3遺傳算法
5.4函數(shù)正則化
第6章數(shù)據(jù)優(yōu)化
6.1數(shù)據(jù)規(guī)范化
6.2異常值清理
6.3平滑法
6.4聚類
6.5特征工程
第7章時(shí)間序列
7.1時(shí)間序列簡介
7.2時(shí)間序列數(shù)據(jù)探索
7.2.1加法模型下的可視化圖
7.2.2乘法模型下的部分可視化圖
7.3時(shí)間序列特征提取
7.3.1時(shí)間特征
7.3.2滯后特征
7.3.3基于移動(dòng)窗口的特征
7.3.4基于展開窗口的特征
7.4時(shí)間序列模型
7.4.1自回歸模型
7.4.2滑動(dòng)平均模型
7.4.3整合移動(dòng)平均自回歸模型
7.4.4季節(jié)性整合移動(dòng)平均自回歸模型
第8章實(shí)戰(zhàn)
8.1M5預(yù)測分析比賽介紹
8.1.1數(shù)據(jù)介紹
8.1.2評(píng)估標(biāo)準(zhǔn)
8.2數(shù)據(jù)清理
8.3基礎(chǔ)建模
8.4優(yōu)化
 

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)