注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡人工智能Python機器學習及實踐:從零開始通往Kaggle競賽之路

Python機器學習及實踐:從零開始通往Kaggle競賽之路

Python機器學習及實踐:從零開始通往Kaggle競賽之路

定 價:¥49.00

作 者: 范淼,李超
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302442875 出版時間: 2016-10-01 包裝:
開本: 16開 頁數(shù): 183 字數(shù):  

內(nèi)容簡介

  本書面向所有對機器學習與數(shù)據(jù)挖掘的實踐及競賽感興趣的讀者,從零開始,以Python編程語言為基礎(chǔ),在不涉及大量數(shù)學模型與復雜編程知識的前提下,逐步帶領(lǐng)讀者熟悉并且掌握當下流行的機器學習、數(shù)據(jù)挖掘與自然語言處理工具,如Scikit-learn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。全書共分4章。第1章簡介篇,介紹機器學習概念與Python編程知識;第2章基礎(chǔ)篇,講述如何使用Scikit-learn作為基礎(chǔ)機器學習工具;第3章進階篇,涉及怎樣借助高級技術(shù)或者模型進一步提升既有機器學習系統(tǒng)的性能;第4章競賽篇,以Kaggle平臺為對象,幫助讀者一步步使用本書介紹過的模型和技巧,完成三項具有代表性的競賽任務。

作者簡介

  范淼,清華大學計算機系人工智能研究所博士,研究方向涉及機器學習與自然語言處理技術(shù)。2015年3月受國家留學基金委公派至美國紐約大學計算機系聯(lián)合培養(yǎng)。攻讀博士期間,于所在研究領(lǐng)域內(nèi)多個重要國際會議與期刊上發(fā)表論文近20篇。先后在Hulu、MSRA(微軟亞洲研究院)、百度自然語言處理部、Bosch(博世)北美硅谷研究院等多個公司的研發(fā)部門實習,并承擔機器學習與自然語言處理相關(guān)的研究任務。李超, 工學博士,清華大學副研究員,信息技術(shù)研究院Web 與軟件技術(shù)研究中心副主任。中國計算機學會信息存儲技術(shù)專委會委員、中國計算機學會高級會員、全國文獻影像技術(shù)標準化技術(shù)委員會(SAC/TC86/SC6)委員、IEEE 會員。研究領(lǐng)域包括海量數(shù)據(jù)存儲、組織與管理、分析,及其在數(shù)字圖書館/檔案館/教育/醫(yī)療/金融等領(lǐng)域的應用。主持及參與多項國家973、863、科技支撐、自然基金等縱向項目及橫向合作項目。已發(fā)表學術(shù)論文50 余篇、獲得授權(quán)發(fā)明專利10 余項。

圖書目錄

第1章 簡介篇..............................................................1
1.1 機器學習綜述..............................................................1
1.1.1 任務....................................................................3
1.1.2 經(jīng)驗....................................................................5
1.1.3 性能....................................................................5
1.2 Python編程庫..............................................................8
1.2.1 為什么使用Python........................................................8
1.2.2 Python機器學習的優(yōu)勢....................................................9
1.2.3 NumPy & SciPy..........................................................10
1.2.4 Matplotlib.............................................................11
1.2.5 Scikit-learn..........................................................11
1.2.6 Pandas.................................................................11
1.2.7 Anaconda...............................................................12
1.3 Python環(huán)境配置...........................................................12
1.3.1 Windows系統(tǒng)環(huán)境........................................................12
1.3.2 Mac OS 系統(tǒng)環(huán)境........................................................17
1.4 Python編程基礎(chǔ)...........................................................18
1.4.1 Python基本語法.........................................................19
1.4.2 Python 數(shù)據(jù)類型........................................................20
1.4.3 Python 數(shù)據(jù)運算........................................................22
1.4.4 Python 流程控制........................................................26
1.4.5 Python 函數(shù)(模塊)設(shè)計................................................28
1.4.6 Python 編程庫(包)的導入..............................................29
1.4.7 Python 基礎(chǔ)綜合實踐....................................................30
1.5章末小結(jié)..............................................................33第2章 基礎(chǔ)篇..............................................................34
2.1監(jiān)督學習經(jīng)典模型.........................................................34
2.1.1分類學習...............................................................35
2.1.1.1 線性分類器
2.1.1.2 支持向量機(分類)
2.1.1.3 樸素貝葉斯
2.1.1.4 K近鄰(分類)
2.1.1.5 決策樹
2.1.1.6 集成模型(分類)
2.1.2回歸預測...............................................................64
2.1.2.1 線性回歸器
2.1.2.2 支持向量機(回歸)
2.1.2.3 K近鄰(回歸)
2.1.2.4 回歸樹
2.1.2.5 集成模型(回歸)
2.2 無監(jiān)督學習經(jīng)典模型.......................................................81
2.2.1數(shù)據(jù)聚類......................................................81
2.2.1.1 K均值算法
2.2.2特征降維...............................................................91
2.2.2.1 主成分分析
2.3 章末小結(jié).................................................................97第3章 進階篇...............................................................98
3.1 模型實用技巧.............................................................98? 
3.1.1 特征提升...............................................................99
3.1.2 模型正則化............................................................111
3.1.3 模型檢驗..............................................................121
3.1.4 超參數(shù)搜索............................................................122
3.2 流行庫/模型實踐.........................................................129
3.2.1自然語言處理包(NLTK)................................................131
3.2.2 詞向量(Word2Vec)技術(shù)................................................133
3.2.3 XGBoost模型...........................................................138
3.2.4 Tensorflow框架........................................................140
3.3 章末小結(jié)................................................................152第4章 實戰(zhàn)篇..............................................................153
4.1 Kaggle平臺簡介..........................................................153
4.2 Titanic罹難乘客預測.....................................................157
4.3 IMDB影評得分估計........................................................165
4.4 MNIST手寫體數(shù)字圖片識別.................................................174
4.5 章末小結(jié)................................................................180后記.....................................................................181參考文獻.................................................................182

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號