注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件數(shù)據(jù)科學(xué)工程實(shí)踐:用戶行為分析與建模、A/B實(shí)驗(yàn)、SQLFlow

數(shù)據(jù)科學(xué)工程實(shí)踐:用戶行為分析與建模、A/B實(shí)驗(yàn)、SQLFlow

數(shù)據(jù)科學(xué)工程實(shí)踐:用戶行為分析與建模、A/B實(shí)驗(yàn)、SQLFlow

定 價(jià):¥89.00

作 者: 謝梁,繆瑩瑩,高梓堯,王子玲 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111682547 出版時(shí)間: 2021-07-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 259 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是一本將數(shù)據(jù)科學(xué)三要素一一商業(yè)理解、量化模型、數(shù)據(jù)技術(shù)全面打通的實(shí)戰(zhàn)性著作,是來(lái)自騰訊、滴滴、快手等一線互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師和算法工程師的經(jīng)驗(yàn)總結(jié),得到了SQLFlow創(chuàng)始人以及騰訊、網(wǎng)易、快手、貝殼找房、谷歌等企業(yè)的專家一致好評(píng)和推薦。 《數(shù)據(jù)科學(xué)工程實(shí)踐:用戶行為分析與建模、A/B實(shí)驗(yàn)、SQLFlow》三個(gè)部分,內(nèi)容相對(duì)獨(dú)立,既能幫助初學(xué)者建立知識(shí)體系,又能幫助從業(yè)者解決商業(yè)中的實(shí)際問(wèn)題,還能幫助有經(jīng)驗(yàn)的專家快速掌握數(shù)據(jù)科學(xué)的新技術(shù)和發(fā)展動(dòng)向。內(nèi)容圍繞非實(shí)驗(yàn)環(huán)境下的觀測(cè)數(shù)據(jù)的分析、實(shí)驗(yàn)的設(shè)計(jì)和分析、自助式數(shù)據(jù)科學(xué)平臺(tái)3大主題展開,涉及統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)、機(jī)器學(xué)習(xí)、實(shí)驗(yàn)科學(xué)等多個(gè)領(lǐng)域,包含大量常用的數(shù)據(jù)科學(xué)方法、簡(jiǎn)潔的代碼實(shí)現(xiàn)和經(jīng)典的實(shí)戰(zhàn)案例?!〉?部分(第1-6章)觀測(cè)數(shù)據(jù)的分析技術(shù) 講解了非實(shí)驗(yàn)環(huán)境下不同觀測(cè)數(shù)據(jù)分析場(chǎng)景所對(duì)應(yīng)的分析框架、原理及實(shí)際操作,包括消費(fèi)者選擇偏好分析、消費(fèi)者在時(shí)間維度上的行為分析、基于機(jī)器學(xué)習(xí)的用戶生命周期價(jià)值預(yù)測(cè)、基于可解釋模型技術(shù)的商業(yè)場(chǎng)景挖掘、基于矩陣分解技術(shù)的用戶行為規(guī)律發(fā)現(xiàn)與挖掘,以及在不能進(jìn)行實(shí)驗(yàn)分析時(shí)如何更科學(xué)地進(jìn)行全量評(píng)估等內(nèi)容。第二部分(第7~9章)實(shí)驗(yàn)設(shè)計(jì)和分析技術(shù) 從A/B實(shí)驗(yàn)的基本原理出發(fā),深入淺出地介紹了各種商業(yè)場(chǎng)景下進(jìn)行實(shí)驗(yàn)設(shè)計(jì)需要參考的原則和運(yùn)用的方法,尤其是在有樣本量約束條件下提升實(shí)驗(yàn)效能的方法及商業(yè)場(chǎng)景限制導(dǎo)致的非傳統(tǒng)實(shí)驗(yàn)設(shè)計(jì)?!〉谌糠郑ǖ?0~12章)自助式數(shù)據(jù)科學(xué)平臺(tái)SQLFlow 有針對(duì)性地講解了開源的工程化的自助式數(shù)據(jù)科學(xué)平臺(tái)SQLFlow,并通過(guò)系統(tǒng)配置、黑盒模型的解讀器應(yīng)用、聚類分析場(chǎng)景等案例幫助讀者快速了解這一面向未來(lái)的數(shù)據(jù)科學(xué)技術(shù)。

作者簡(jiǎn)介

  謝梁 經(jīng)濟(jì)學(xué)博士,騰訊QQ瀏覽器副總經(jīng)理、QQ瀏覽器數(shù)據(jù)負(fù)責(zé)人。CCF數(shù)據(jù)科學(xué)專委會(huì)創(chuàng)始委員,入選第一財(cái)經(jīng)數(shù)據(jù)科學(xué)50人,清華大學(xué)商學(xué)院及香港大學(xué)商學(xué)院商業(yè)分析碩士項(xiàng)目指導(dǎo)嘉賓。曾任滴滴杰出數(shù)據(jù)科學(xué)家、美國(guó)微軟云存儲(chǔ)核心工程部首席數(shù)據(jù)科學(xué)家。 繆瑩瑩 浙江大學(xué)碩士,曾任滴滴首席數(shù)據(jù)科學(xué)家,CCF數(shù)據(jù)科學(xué)專委會(huì)委員。擁有十余項(xiàng)國(guó)家發(fā)明專利及國(guó)際發(fā)明專利,具有豐富的數(shù)據(jù)倉(cāng)庫(kù)建設(shè)、數(shù)據(jù)挖掘建模、實(shí)驗(yàn)科學(xué)與戰(zhàn)略分析的經(jīng)驗(yàn)。帶領(lǐng)團(tuán)隊(duì)用數(shù)據(jù)的方式驅(qū)動(dòng)從0到1的初創(chuàng)形態(tài)的業(yè)務(wù)和成熟形態(tài)業(yè)務(wù)的增長(zhǎng),善于發(fā)現(xiàn)業(yè)務(wù)機(jī)會(huì)和風(fēng)險(xiǎn),給業(yè)務(wù)帶來(lái)巨大價(jià)值。 高梓堯 快手?jǐn)?shù)據(jù)分析總監(jiān),長(zhǎng)期在美國(guó)硅谷和中國(guó)多家互聯(lián)網(wǎng)科技公司從事用戶分析、實(shí)驗(yàn)設(shè)計(jì)等相關(guān)工作。曾帶領(lǐng)滴滴數(shù)據(jù)科學(xué)團(tuán)隊(duì)與螞蟻金服聯(lián)合開源共建一站式機(jī)器學(xué)習(xí)工具SQLFlow。擁有多項(xiàng)國(guó)家發(fā)明專利。清華大學(xué)商學(xué)院及哥倫比亞大學(xué)商學(xué)院商業(yè)分析碩士項(xiàng)目指導(dǎo)嘉賓、泛華統(tǒng)計(jì)協(xié)會(huì)演講嘉賓。 王子玲 上海交通大學(xué)計(jì)算數(shù)學(xué)碩士,曾任滴滴高級(jí)數(shù)據(jù)科學(xué)家、高級(jí)模型專家、高級(jí)風(fēng)控專家。先后任職于日企MTI、人人網(wǎng)、滴滴出行、愛(ài)奇藝等知名互聯(lián)網(wǎng)企業(yè),在網(wǎng)約車出行、互聯(lián)網(wǎng)金融、在線音樂(lè)、短視頻、網(wǎng)游等領(lǐng)域積累了豐富的大數(shù)據(jù)分析、策略、挖掘、建模、研究、應(yīng)用經(jīng)驗(yàn)。負(fù)責(zé)過(guò)兩段公司級(jí)重點(diǎn)項(xiàng)目從0到1增長(zhǎng)的整體數(shù)據(jù)驅(qū)動(dòng)體系設(shè)計(jì)及落地。申請(qǐng)平臺(tái)智能定價(jià)及優(yōu)化算法系統(tǒng)等十余項(xiàng)國(guó)家發(fā)明專利及國(guó)際發(fā)明專利。 周銀河 現(xiàn)任騰訊數(shù)據(jù)科學(xué)家,曾任滴滴數(shù)據(jù)科學(xué)家,清華大學(xué)商學(xué)院及哥倫比亞大學(xué)商學(xué)院商業(yè)分析碩士項(xiàng)目指導(dǎo)嘉賓。擁有豐富的數(shù)據(jù)分析、統(tǒng)計(jì)建模及實(shí)驗(yàn)設(shè)計(jì)經(jīng)驗(yàn)。 丁芬 曾任滴滴數(shù)據(jù)科學(xué)家,曾就職于美團(tuán)、滴滴等國(guó)內(nèi)知名互聯(lián)網(wǎng)公司,工作經(jīng)歷涉及市場(chǎng)咨詢、信貸風(fēng)控、網(wǎng)約車交易及信息流等領(lǐng)域。 蘇濤 物理學(xué)博士,美國(guó)生物物理學(xué)會(huì)會(huì)員。曾任中國(guó)科學(xué)院研究助理,研究量子計(jì)算和主動(dòng)流體。后任喬治華盛頓大學(xué)計(jì)算物理研究員,從事細(xì)胞模擬、生物領(lǐng)域機(jī)器學(xué)習(xí)、高性能計(jì)算等方向的研究。2017年進(jìn)入互聯(lián)網(wǎng)行業(yè),先后在Elex 和滴滴進(jìn)行數(shù)學(xué)模型、算法和數(shù)據(jù)科學(xué)方向的研究,熟悉復(fù)雜網(wǎng)絡(luò)、流形幾何嵌入、時(shí)頻分析以及相關(guān)的機(jī)器學(xué)習(xí)和優(yōu)化方法。 王禹 曾任滴滴高級(jí)數(shù)據(jù)分析師,主要負(fù)責(zé)滴滴分單引擎和調(diào)度引擎的實(shí)驗(yàn)設(shè)計(jì)、評(píng)估、數(shù)據(jù)分析以及成交率等核心指標(biāo)的預(yù)測(cè)、異常診斷歸因等工作?,F(xiàn)任某短視頻科技企業(yè)算法工程師,主要負(fù)責(zé)LBS定位、POI挖掘等相關(guān)場(chǎng)景的策略算法開發(fā)。 吳君涵 曾任滴滴資深數(shù)據(jù)分析師,擅長(zhǎng)用戶增長(zhǎng)分析和體驗(yàn)量化建模。具有豐富的大數(shù)據(jù)挖掘建模、產(chǎn)出數(shù)據(jù)驅(qū)動(dòng)洞察并通過(guò)洞察影響決策的實(shí)戰(zhàn)經(jīng)驗(yàn)。 楊驍捷 曾任滴滴高級(jí)數(shù)據(jù)分析師,擅長(zhǎng)雙邊平臺(tái)的供需匹配效率分析,在出行、電商等不同業(yè)務(wù)場(chǎng)景中靈活運(yùn)用因果推斷,評(píng)估業(yè)務(wù)收益。現(xiàn)任快手資深數(shù)據(jù)分析師。 劉沖 曾任滴滴高級(jí)數(shù)據(jù)分析師,主要負(fù)責(zé)流量運(yùn)營(yíng)的實(shí)驗(yàn)設(shè)計(jì)、評(píng)估、數(shù)據(jù)分析以及優(yōu)化司機(jī)行為和提高司機(jī)收入等相關(guān)分析,現(xiàn)任快手?jǐn)?shù)據(jù)分析師。 王玉璽 中國(guó)人民大學(xué)商學(xué)院博士,美國(guó)密歇根大學(xué)訪問(wèn)學(xué)者,曾任滴滴數(shù)據(jù)科學(xué)部研究員,主要研究方向?yàn)槎▋r(jià)策略優(yōu)化、消費(fèi)者行為分析等。參與多項(xiàng)國(guó)家自然科學(xué)基金及社會(huì)科學(xué)基金研究項(xiàng)目,在Expert System、Information Systems Research、《管理評(píng)論》等期刊發(fā)表多篇論文。 劉未名 曾任滴滴數(shù)據(jù)科學(xué)家,擁有金融、互聯(lián)網(wǎng)等領(lǐng)域的數(shù)據(jù)分析經(jīng)驗(yàn),擅長(zhǎng)利用實(shí)驗(yàn)、量化模型解決業(yè)務(wù)問(wèn)題,多次參與公司級(jí)重點(diǎn)項(xiàng)目的數(shù)據(jù)分析,幫助公司搭建數(shù)據(jù)驅(qū)動(dòng)工業(yè)化體系,擁有國(guó)內(nèi)、國(guó)際多項(xiàng)發(fā)明專利。 楊凱迪 現(xiàn)任快手?jǐn)?shù)據(jù)分析部數(shù)據(jù)科學(xué)家。長(zhǎng)期就職于國(guó)內(nèi)頭部互聯(lián)網(wǎng)企業(yè),對(duì)于出行定價(jià)補(bǔ)貼以及短視頻行業(yè)用戶畫像挖掘、策略分析等有豐富經(jīng)驗(yàn)。工作期間累計(jì)發(fā)表三篇國(guó)家發(fā)明專利論文。 李依諾 騰訊數(shù)據(jù)科學(xué)家,本碩先后畢業(yè)于美國(guó)印第安納大學(xué)數(shù)學(xué)專業(yè)和美國(guó)喬治華盛頓大學(xué)生物統(tǒng)計(jì)學(xué)專業(yè)。在在線視頻、網(wǎng)約車、網(wǎng)絡(luò)游戲領(lǐng)域積累了豐富的數(shù)據(jù)科學(xué)實(shí)戰(zhàn)經(jīng)驗(yàn),從0 到1 參與過(guò)騰訊、滴滴的實(shí)驗(yàn)工業(yè)化進(jìn)程。 陳祥 資深算法工程師,碩士畢業(yè)于愛(ài)丁堡大學(xué)計(jì)算機(jī)科學(xué)專業(yè)。先后從事異常檢測(cè)、強(qiáng)化學(xué)習(xí)、自然語(yǔ)言處理、領(lǐng)域知識(shí)圖譜建設(shè)及應(yīng)用等相關(guān)工作。曾就職于愛(ài)奇藝、滴滴。SQLFlow 貢獻(xiàn)者之一?,F(xiàn)從事用戶畫像、廣告系統(tǒng)和推薦相關(guān)工作。 朱文靜 曾任滴滴高級(jí)數(shù)據(jù)分析師,主要從事基于業(yè)務(wù)數(shù)據(jù)進(jìn)行的分析、建模、挖掘等工作。SQLFlow項(xiàng)目重要成員之一,SQLFlow開源社區(qū)貢獻(xiàn)者,參與貢獻(xiàn)了多個(gè)SQLFlow模型,其中包括可解釋黑盒模型、深度學(xué)習(xí)聚類模型、時(shí)間序列模型等。

圖書目錄

作者簡(jiǎn)介
序一
序二
前言
第一部分 觀測(cè)數(shù)據(jù)的分析技術(shù)
第1章 如何分析用戶的選擇 2
1.1 深入理解選擇行為 2
1.1.1 選擇無(wú)處不在 2
1.1.2 選擇行為的經(jīng)濟(jì)學(xué)理論 4
1.1.3 離散選擇模型 5
1.2 DCM詳述 6
1.2.1 從經(jīng)濟(jì)模型到計(jì)量模型 6
1.2.2 DCM的應(yīng)用場(chǎng)景 9
1.2.3 DCM的重要數(shù)學(xué)知識(shí) 10
1.3 DCM模型的Python實(shí)踐 13
1.3.1 軟件包和數(shù)據(jù)格式 13
1.3.2 使用邏輯回歸分析自駕選擇問(wèn)題 16
1.3.3 使用多項(xiàng)Logit模型分析多種交通方式選擇問(wèn)題 21
1.3.4 使用嵌套Logit模型分析多種交通方式選擇問(wèn)題 24
1.4 本章小結(jié) 26
第2章 與時(shí)間相關(guān)的行為分析 27
2.1 生存分析與二手車定價(jià)案例 27
2.1.1 二手車定價(jià)背景 27
2.1.2 為什么不選擇一般回歸模型 28
2.1.3 為什么選擇生存分析 29
2.2 生存分析的理論框架 29
2.2.1 生存分析基本概念界定 30
2.2.2 生存函數(shù)刻畫及簡(jiǎn)單對(duì)比 34
2.2.3 生存函數(shù)回歸及個(gè)體生存概率的預(yù)測(cè) 36
2.3 生存分析在二手車定價(jià)案例中的應(yīng)用 37
2.3.1 軟件包、數(shù)據(jù)格式和數(shù)據(jù)讀入 38
2.3.2 繪制二手車銷售生存曲線及差異對(duì)比 40
2.3.3 二手車銷售生存概率影響因素分析及個(gè)體預(yù)測(cè) 43
2.3.4 基于Cox風(fēng)險(xiǎn)比例模型的最優(yōu)價(jià)格求解 44
2.4 本章小結(jié) 46
第3章 洞察用戶長(zhǎng)期價(jià)值:基于神經(jīng)網(wǎng)絡(luò)的LTV建模 47
3.1 用戶長(zhǎng)期價(jià)值的概念和商業(yè)應(yīng)用 47
3.1.1 用戶長(zhǎng)期價(jià)值 47
3.1.2 用戶生命周期和用戶長(zhǎng)期價(jià)值 48
3.1.3 LTV的特點(diǎn) 49
3.1.4 LTV分析能解決的問(wèn)題 50
3.1.5 LTV的計(jì)算方法 50
3.2 基于Keras的LTV模型實(shí)踐 52
3.2.1 Keras介紹 52
3.2.2 數(shù)據(jù)的加載和預(yù)處理 52
3.2.3 輸入數(shù)據(jù)的準(zhǔn)備 56
3.2.4 模型搭建和訓(xùn)練 61
3.2.5 模型分析 65
3.3 本章小結(jié) 66
第4章 使用體系化分析方法進(jìn)行場(chǎng)景挖掘 67
4.1 經(jīng)驗(yàn)化分析與體系化分析 67
4.1.1 經(jīng)驗(yàn)化分析的局限性 67
4.1.2 體系化分析的優(yōu)勢(shì) 68
4.2 體系化分析常用工具 69
4.2.1 黑盒模型與白盒模型 69
4.2.2 可解釋模型—決策樹 69
4.2.3 全局代理模型 73
4.2.4 場(chǎng)景挖掘模型分析方法框架 75
4.3 場(chǎng)景挖掘分析的應(yīng)用與實(shí)現(xiàn) 75
4.3.1 數(shù)據(jù)背景及數(shù)據(jù)處理 76
4.3.2 經(jīng)驗(yàn)化分析方法應(yīng)用 76
4.3.3 場(chǎng)景挖掘模型的Python實(shí)現(xiàn)與模型解讀 79
4.4 本章小結(jié) 86
第5章 行為規(guī)律的發(fā)現(xiàn)與挖掘 87
5.1 對(duì)有序數(shù)據(jù)的規(guī)律分析 88
5.1.1 有序數(shù)據(jù)及SVD方法概述 88
5.1.2 SVD原理及推導(dǎo) 88
5.2 SVD聚類建模Python實(shí)戰(zhàn) 93
5.3 對(duì)無(wú)序稀疏數(shù)據(jù)的規(guī)律分析 101
5.3.1 稀疏數(shù)據(jù)及NMF方法概述 101
5.3.2 NMF原理及推導(dǎo) 102
5.3.3 NMF聚類建模Python實(shí)戰(zhàn) 103
5.4 本章小結(jié) 109
第6章 對(duì)觀測(cè)到的事件進(jìn)行因果推斷 110
6.1 使用全量評(píng)估分析已發(fā)生的事件 110
6.2 全量評(píng)估的主要方法 111
6.2.1 回歸分析 111
6.2.2 DID方法 118
6.2.3 合成控制 120
6.2.4 Causal Impact方法 122
6.3 全量評(píng)估方法的應(yīng)用 124
6.3.1 使用回歸建模方法對(duì)物流單量變化進(jìn)行全量評(píng)估 125
6.3.2 使用DID方法評(píng)估恐怖主義對(duì)經(jīng)濟(jì)的影響 131
6.3.3 用合成控制法評(píng)估恐怖主義對(duì)經(jīng)濟(jì)的影響 134
6.3.4 用Causal Impact方法評(píng)估天氣情況 136
6.4 本章小結(jié) 146
第二部分 實(shí)驗(yàn)設(shè)計(jì)和分析技術(shù)
第7章 如何比較兩個(gè)策略的效果 148
7.1 正確推斷因果關(guān)系 148
7.1.1 相關(guān)性謬誤 148
7.1.2 潛在結(jié)果和因果效果 149
7.2 運(yùn)用A/B實(shí)驗(yàn)進(jìn)行策略比較 150
7.2.1 什么是A/B實(shí)驗(yàn) 151
7.2.2 為什么應(yīng)用A/B實(shí)驗(yàn) 151
7.2.3 A/B實(shí)驗(yàn)的基本原理 151
7.3 A/B實(shí)驗(yàn)應(yīng)用步驟 152
7.3.1 明確實(shí)驗(yàn)要素 152
7.3.2 實(shí)驗(yàn)設(shè)計(jì) 154
7.3.3 實(shí)驗(yàn)過(guò)程監(jiān)控 155
7.4 A/B實(shí)驗(yàn)案例 156
7.4.1 實(shí)驗(yàn)場(chǎng)景介紹 156
7.4.2 實(shí)驗(yàn)方法設(shè)計(jì) 157
7.4.3 實(shí)驗(yàn)效果評(píng)估 157
7.5 本章小結(jié) 159
第8章 提高實(shí)驗(yàn)效能 160
8.1 控制實(shí)驗(yàn)指標(biāo)方差的必要性和手段 160
8.2 用隨機(jī)區(qū)組設(shè)計(jì)控制實(shí)驗(yàn)指標(biāo)方差 161
8.2.1 利用隨機(jī)區(qū)組實(shí)驗(yàn)降低方差 161
8.2.2 隨機(jī)區(qū)組實(shí)驗(yàn)的特征選擇 162
8.3 隨機(jī)區(qū)組實(shí)驗(yàn)應(yīng)用步驟 163
8.4 隨機(jī)區(qū)組實(shí)驗(yàn)案例介紹 167
8.4.1 背景介紹 168
8.4.2 基本設(shè)計(jì) 168
8.4.3 隨機(jī)區(qū)組實(shí)驗(yàn)相關(guān)的設(shè)計(jì) 168
8.4.4 效果評(píng)估 169
8.5 隨機(jī)區(qū)組實(shí)驗(yàn)的常見(jiàn)問(wèn)題 170
8.6 本章小結(jié) 171
第9章 特殊場(chǎng)景下的實(shí)驗(yàn)設(shè)計(jì)和分析方法 172
9.1 解決分流實(shí)驗(yàn)對(duì)象之間的干擾 172
9.1.1 使用隨機(jī)飽和度實(shí)驗(yàn)減少實(shí)驗(yàn)對(duì)象之間的影響 173
9.1.2 隨機(jī)濃度實(shí)驗(yàn)的設(shè)計(jì)流程 174
9.1.3 隨機(jī)濃度實(shí)驗(yàn)評(píng)估方法及案例 175
9.2 Switchback實(shí)驗(yàn)和評(píng)估方法 178
9.2.1 不能使用隨機(jī)分流策略的情況 178
9.2.2 Switchback實(shí)驗(yàn)的基本原理 178
9.2.3 Switchback實(shí)驗(yàn)中關(guān)于時(shí)空切片的聚類方法 179
9.2.4 Switchback實(shí)驗(yàn)的評(píng)估方法 180
9.3 交叉實(shí)驗(yàn) 182
9.3.1 交叉實(shí)驗(yàn)的基本概念 183
9.3.2 常見(jiàn)的交叉實(shí)驗(yàn)設(shè)計(jì)矩陣 183
9.3.3 交叉實(shí)驗(yàn)評(píng)估及矩陣誤差說(shuō)明 185
9.3.4 交叉實(shí)驗(yàn)評(píng)估案例 186
9.4 強(qiáng)約束條件下的實(shí)驗(yàn)方法 189
9.4.1 強(qiáng)約束條件場(chǎng)景 189
9.4.2 多基線實(shí)驗(yàn)設(shè)計(jì)的解決思路 189
9.4.3 多基線實(shí)驗(yàn)的設(shè)計(jì)流程 190
9.4.4 多基線實(shí)驗(yàn)的評(píng)估方法和案例 192
9.5 本章小結(jié) 195
第三部分 自助式數(shù)據(jù)科學(xué)平臺(tái)SQLFlow
第10章 SQLFlow 198
10.1 SQLFlow簡(jiǎn)介 198
10.1.1 什么是SQLFlow 198
10.1.2 SQLFlow的定位和目標(biāo) 199
10.1.3 SQLFlow的工作原理 200
10.2 設(shè)置SQLFlow運(yùn)行環(huán)境 201
10.2.1 通過(guò)Docker使用SQLFlow 201
10.2.2 環(huán)境配置 205
10.2.3 交互 210
10.2.4 Jupyter Notebook 210
10.2.5 REPL 211
10.3 向SQLFlow提交分析模型 211
10.4 本章小結(jié) 214
第11章 機(jī)器學(xué)習(xí)模型可解釋性 215
11.1 模型的可解釋性 215
11.1.1 模型可解釋的重要性 215
11.1.2 模型可解釋的必要性 216
11.2 常見(jiàn)的可解釋模型 216
11.2.1 線性回歸 216
11.2.2 邏輯回歸 219
11.2.3 決策樹 224
11.2.4 KNN算法 225
11.2.5 樸素貝葉斯分類器 228
11.2.6 模型比較 229
11.3 黑盒模型的解釋性 230
11.3.1 黑盒模型解釋方法 230
11.3.2 SQLFlow中的黑盒模型解釋應(yīng)用 233
11.4 本章小結(jié) 237
第12章 基于LSTM-Autoencoder的無(wú)監(jiān)督聚類模型 238
12.1 聚類分析的廣泛應(yīng)用 238
12.2 聚類模型的應(yīng)用案例 239
12.2.1 K均值聚類 239
12.2.2 層次聚類 245
12.3 SQLFlow中基于深度學(xué)習(xí)的聚類模型 250
12.3.1 基于深度學(xué)習(xí)的聚類算法原理 250
12.3.2 城市道路交通狀況的模式識(shí)別與聚類 256
12.4 本章小結(jié) 259

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)