注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫Python金融數(shù)據(jù)挖掘與分析實戰(zhàn)

Python金融數(shù)據(jù)挖掘與分析實戰(zhàn)

Python金融數(shù)據(jù)挖掘與分析實戰(zhàn)

定 價:¥109.00

作 者: 劉鵬,高中強
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111696506 出版時間: 2021-12-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 416 字數(shù):  

內(nèi)容簡介

  這是一本金融數(shù)據(jù)挖掘與分析領(lǐng)域的實戰(zhàn)性著作,它能指導(dǎo)零Python編程基礎(chǔ)和零數(shù)據(jù)挖掘與分析基礎(chǔ)的讀者快速掌握金融數(shù)據(jù)挖掘與分析的工具、技術(shù)和方法。讀完本書,你將會有如下3個方面的收獲:(1)Python編程基礎(chǔ)和數(shù)據(jù)預(yù)處理首先詳細講解了Python的核心語法,以及NumPy、Matplotlib、PySpark、Jupyter Notebook等Python數(shù)據(jù)處理工具的使用;然后詳細介紹了數(shù)據(jù)預(yù)處理的流程和技巧。通過深入淺出的語言和豐富的樣例展示,幫助初學(xué)者快速上手 Python,為之后的數(shù)據(jù)分析實戰(zhàn)夯實基礎(chǔ)。(2)數(shù)據(jù)挖掘與分析的經(jīng)典方法詳細講解了經(jīng)典的數(shù)據(jù)挖掘方法,包括聚類分析、回歸分析、分類分析、異常檢測、關(guān)聯(lián)分析、時間序列分析等。(3)主要金融應(yīng)用場景的數(shù)據(jù)挖掘方法針對網(wǎng)絡(luò)輿情的采集和熱點分析、輿情分析中的情感分析、股價趨勢預(yù)測、個人信用評分、企業(yè)信用評分、用戶畫像、目標客戶精準分析、銷售數(shù)據(jù)分析等金融行業(yè)的常見應(yīng)用場景,給出了數(shù)據(jù)挖掘和分析的方法。本書注重實戰(zhàn),配有大量精心設(shè)計的案例,同時還有配套的視頻講解、代碼和數(shù)據(jù)資源,可操作性強。

作者簡介

  劉鵬教授,清華大學(xué)博士,云計算、大數(shù)據(jù)和人工智能領(lǐng)域的知名專家,南京云創(chuàng)大數(shù)據(jù)科技股份有限公司總裁、中國大數(shù)據(jù)應(yīng)用聯(lián)盟人工智能專家委員會主任。中國電子學(xué)會云計算專家委員會云存儲組組長、工業(yè)和信息化部云計算研究中心專家。中國信息協(xié)會教育分會人工智能教育專家委員會主任、教育部全國普通高校畢業(yè)生就業(yè)創(chuàng)業(yè)指導(dǎo)委員會委員、“2019年全國大學(xué)生數(shù)學(xué)建模比賽”命題人、“第45屆世界技能大賽”中國區(qū)云計算選拔賽裁判長/專家指導(dǎo)組組長、2002 PennySort國際計算機排序比賽冠軍與2003年全國挑戰(zhàn)杯總冠軍。提出的反垃圾郵件網(wǎng)格,被IEEE Cluster 2003評為杰出網(wǎng)格項目,為解決困擾全球的垃圾郵件問題做出根本貢獻,該技術(shù)成為云安全技術(shù)的基礎(chǔ)。高中強人工智能與大數(shù)據(jù)領(lǐng)域技術(shù)專家,有非常深厚的積累,擅長機器學(xué)習(xí)和自然語言處理,尤其是深度學(xué)習(xí),熟悉Tensorflow、PyTorch等深度學(xué)習(xí)開發(fā)框架。曾獲“2019年全國大學(xué)生數(shù)學(xué)建模優(yōu)秀命題人獎”。參與鐘南山院士指導(dǎo)新型冠狀病毒人工智能預(yù)測系統(tǒng)研發(fā)項目,與鐘南山院士團隊共同發(fā)表學(xué)術(shù)論文《Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions》。合著有參《人工智能:從小白到大神》、《人工智能數(shù)學(xué)基礎(chǔ)》等著作。

圖書目錄

前 言
第1章 Python工作環(huán)境準備  1
1.1 Anaconda環(huán)境安裝  1
1.2 常用Python 交互工具  4
1.3 Jupyter Notebook簡介  6
1.4 習(xí)題  9
第2章 Python入門  10
2.1 Python基礎(chǔ)知識  10
2.2 Python基礎(chǔ)語法  11
2.3 Python變量類型  15
2.4 Python運算符  20
2.4.1 算術(shù)運算符  20
2.4.2 比較運算符  22
2.4.3 賦值運算符  23
2.4.4 按位運算符  24
2.4.5 邏輯運算符  25
2.4.6 成員運算符  26
2.4.7 身份運算符  27
2.4.8 運算符優(yōu)先級  28
2.5 Python條件與循環(huán)語句  29
2.5.1 條件語句  29
2.5.2 循環(huán)語句  31
2.6 Python函數(shù)  38
2.7 Python模塊  43
2.8 Python 文件處理  46
2.9 Python異常  48
2.10 數(shù)據(jù)分析相關(guān)庫  50
2.10.1 NumPy  50
2.10.2 Matplotlib  51
2.10.3 PySpark  53
2.10.4 其他常用庫  54
2.11 習(xí)題  55
第3章 數(shù)據(jù)預(yù)處理  56
3.1 數(shù)據(jù)分析工作流程  56
3.2 數(shù)據(jù)預(yù)處理  58
3.2.1 數(shù)據(jù)集導(dǎo)入  59
3.2.2 數(shù)據(jù)概覽  60
3.2.3 數(shù)據(jù)清洗  61
3.2.4 類別變量轉(zhuǎn)換  66
3.2.5 數(shù)據(jù)分割  67
3.2.6 特征縮放  68
3.3 鳥瞰機器學(xué)習(xí)  71
3.4 習(xí)題  72
第4章 數(shù)據(jù)挖掘方法  74
4.1 分類分析  74
4.1.1 決策樹  75
4.1.2 支持向量機  75
4.1.3 分類算法的選擇  76
4.2 聚類分析  76
4.2.1 K均值算法  77
4.2.2 聚類算法和分類算法的區(qū)別  78
4.3 回歸分析  78
4.3.1 變量間的關(guān)系  79
4.3.2 回歸分析算法的分類和步驟  79
4.3.3 回歸分析算法的選擇  81
4.4 關(guān)聯(lián)分析  81
4.4.1 關(guān)聯(lián)規(guī)則  82
4.4.2 關(guān)聯(lián)規(guī)則的序列模式  82
4.5 時間序列分析  83
4.5.1 時間序列分析方法和步驟  83
4.5.2 時間序列的三種預(yù)測模式   85
4.6 異常檢測  85
4.7 推薦算法  86
4.8 習(xí)題  89
第5章 網(wǎng)絡(luò)輿情采集與熱點分析  90
5.1 網(wǎng)絡(luò)輿情概述  90
5.1.1 大數(shù)據(jù)網(wǎng)絡(luò)輿情背景  90
5.1.2 輿情處理過程  91
5.2 輿情數(shù)據(jù)采集  94
5.2.1 網(wǎng)絡(luò)輿情采集工具  95
5.2.2 網(wǎng)絡(luò)輿情數(shù)據(jù)爬取實例  100
5.3 實戰(zhàn):微博熱點話題聚類  104
5.4 習(xí)題  110
第6章 輿情研判之情感分類  112
6.1 情感分析介紹  112
6.1.1 情感分析分類  112
6.1.2 情感分析文本預(yù)處理  114
6.1.3 實戰(zhàn):中文文本處理練習(xí)  115
6.2 情感分類方法  118
6.2.1 基于詞典的情感分類  118
6.2.2 基于機器學(xué)習(xí)的情感分類  121
6.2.3 基于深度學(xué)習(xí)模型的情感分類  122
6.3 情感分類實戰(zhàn)演練  131
6.3.1 淘寶家電商品評論情感分類預(yù)測  131
6.3.2 客戶評論情感傾向預(yù)測  134
6.4 習(xí)題  140
第7章 用機器學(xué)習(xí)方法預(yù)測股價  142
7.1 股市數(shù)據(jù)分析價值  142
7.1.1 案例背景  142
7.1.2 案例價值  143
7.2 ARIMA模型  144
7.3 實戰(zhàn):基于SVM和ARIMA的股價預(yù)測  145
7.4  習(xí)題  156
第8章 用人工智能方法預(yù)測股價  157
8.1 神經(jīng)網(wǎng)絡(luò)預(yù)測方法  157
8.1.1 門控循環(huán)單元  158
8.1.2 VADER情感分析  158
8.2 實戰(zhàn):基于LSTM和GRU的股價預(yù)測  159
8.3 實戰(zhàn):股票市場新聞情感分析  165
8.4 習(xí)題  172
第9章 個人信用評分  173
9.1 個人信用評分概述  173
9.1.1 需求背景  174
9.1.2 國內(nèi)外發(fā)展狀況  175
9.2 信用評分的技術(shù)與方法  176
9.2.1 信用評分的簡要歷史  176
9.2.2 信用評分的主要模型與方法  176
9.3 信用評分卡模型  180
9.3.1 模型介紹  180
9.3.2 數(shù)據(jù)分箱  180
9.3.3 WOE值  182
9.3.4 IV值  183
9.3.5 邏輯回歸算法原理  185
9.3.6 模型評價指標  186
9.3.7 建立信用評分卡  190
9.4 實戰(zhàn):信用評分卡  190
9.4.1 讀取數(shù)據(jù)  191
9.4.2 數(shù)據(jù)預(yù)處理  191
9.4.3 探索性分析  197
9.4.4 模型分析  204
9.4.5 建立信用評分卡  208
9.5 習(xí)題  211
第10章 個人信用等級評估  213
10.1 概述  213
10.2 個人信用等級評估方法  215
10.2.1 決策樹  215
10.2.2 隨機森林  221
10.2.3 XGBoost簡介  224
10.2.4 多重共線性  228
10.2.5 數(shù)據(jù)重采樣  229
10.3 實戰(zhàn):個人信用等級評估  232
10.3.1 導(dǎo)入相應(yīng)包并讀取數(shù)據(jù)  232
10.3.2 查看數(shù)據(jù)情況  234
10.3.3 數(shù)據(jù)預(yù)處理及相關(guān)函數(shù)構(gòu)建  241
10.3.4 模型訓(xùn)練  244
10.3.5 預(yù)測并生成結(jié)果  251
10.4 習(xí)題  253
第11章 企業(yè)信用評估  255
11.1 企業(yè)信用評估概述  255
11.2 企業(yè)信用評估的技術(shù)與方法  257
11.2.1 支持向量機  257
11.2.2 樸素貝葉斯  259
11.2.3 感知機  260
11.3 實戰(zhàn):企業(yè)信用評估  261
11.3.1 導(dǎo)入相應(yīng)包并讀取數(shù)據(jù)  261
11.3.2 數(shù)據(jù)預(yù)處理  262
11.3.3 可視化各變量總體分布直方圖  264
11.3.4 建模分析預(yù)測企業(yè)違約情況  271
11.3.5 模型評估  273
11.3.6 模型預(yù)測  273
11.4 習(xí)題  274
第12章 用戶畫像  276
12.1 用戶畫像的價值  276
12.1.1 用戶畫像的定義  277
12.1.2 標簽體系  278
12.1.3 用戶畫像的意義  282
12.2 用戶畫像的構(gòu)建  283
12.2.1 用戶畫像的構(gòu)建步驟  283
12.2.2 創(chuàng)建用戶畫像的方法  287
12.2.3 豐富用戶畫像  290
12.3 實戰(zhàn):電商用戶畫像構(gòu)建  292
12.4 實戰(zhàn):電商用戶行為分析  303
12.5 習(xí)題  321
第13章 目標客戶運營  322
13.1 目標客戶運營概述  322
13.2 目標客戶運營模型  323
13.2.1 目標客戶模型探索  323
13.2.2 目標客戶聚類算法  326
13.3 目標客戶的挖掘與分類  330
13.3.1 挖掘目標客戶  331
13.3.2 目標客戶的可視化工具  332
13.3.3 基于RFM模型的客戶分類  333
13.3.4 基于LRFMC模型的客戶分類  334
13.4 實戰(zhàn):商場客戶細分管理  335
13.4.1 導(dǎo)入相關(guān)庫  335
13.4.2 數(shù)據(jù)可視化及分析  336
13.4.3 K均值聚類分析  342
13.5 實戰(zhàn):航空公司VIP客戶體系管理  345
13.5.1 數(shù)據(jù)集說明  345
13.5.2 導(dǎo)入相關(guān)庫  346
13.5.3 數(shù)據(jù)分析及可視化  347
13.5.4 特征屬性的相關(guān)性分析  354
13.5.5 屬性規(guī)約  355
13.5.6 構(gòu)建聚類模型  357
13.5.7 客戶分群可視化  361
13.6 習(xí)題  363
第14章 智能推薦  364
14.1 精準營銷概述  364
14.1.1 傳統(tǒng)營銷  365
14.1.2 新時代營銷  366
14.2 智能推薦概述  367
14.2.1 Apriori算法  369
14.2.2 FP-Growth算法  374
14.2.3 關(guān)聯(lián)規(guī)則的應(yīng)用實例  378
14.3 實戰(zhàn):火鍋店推薦  379
14.3.1 導(dǎo)入相關(guān)庫  380
14.3.2 數(shù)據(jù)可視化及分析  381
14.3.3 特色菜推薦  386
14.3.4 K均值聚類分析  387
14.3.5 智能推薦器  388
14.4 實戰(zhàn):基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘  390
14.4.1 導(dǎo)入相關(guān)庫  391
14.4.2 數(shù)據(jù)可視化及分析  392
14.4.3 關(guān)聯(lián)分析—Apriori算法  398
14.5 習(xí)題  401
參考文獻  403

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號