目錄
第1章集裝箱危險品瞞報預測
1.1業(yè)務背景分析
1.2數據提取
1.3數據預處理
1.3.1數據集成
1.3.2數據清洗
1.3.3數據變換
1.3.4數據離散化
1.3.5特征重要性篩選
1.3.6數據平衡
1.4危險品瞞報預測建模
1.5模型評估
第2章保險產品推薦
2.1業(yè)務背景分析
2.2數據探索
2.3數據預處理
2.4分類模型構建
2.5平衡數據集
2.6算法調參
2.7模型比較
第3章圖書類目自動標引系統(tǒng)
3.1業(yè)務背景分析
3.2數據提取
3.3數據預處理
3.4基于貝葉斯分類的文獻標引
3.4.1增量訓練
3.4.2特征降維與消歧
3.4.3權重調節(jié)
3.5性能評估與結論
3.6基于BERT算法的文獻標引
3.6.1數據預處理
3.6.2構建訓練集
3.6.3模型實現(xiàn)
第4章基于分類算法的學習失敗預警
4.1業(yè)務背景分析
4.2學習失敗風險預測流程
4.3數據收集
4.4數據預處理
4.4.1數據探查及特征選擇
4.4.2數據集劃分及不平衡樣本處理
4.4.3樣本生成及標準化處理
4.5隨機森林算法
4.5.1網格搜索及模型訓練
4.5.2結果分析與可視化
4.5.3特征重要性分析
4.5.4與其他算法比較
第5章自然語言處理技術實例
5.1業(yè)務背景分析
5.2分析框架
5.3數據收集
5.4建立模型
5.4.1文本分詞
5.4.2主題詞提取
5.4.3情感分析
5.4.4語義角色標記
5.4.5語言模型
5.4.6詞向量模型Word2vec
第6章基于標簽的信息推薦系統(tǒng)
6.1業(yè)務背景分析
6.2數據預處理
6.2.1現(xiàn)有系統(tǒng)現(xiàn)狀
6.2.2數據預處理
6.3內容分析
6.4基于協(xié)同過濾推薦
6.4.1用戶偏好矩陣構建
6.4.2用戶相似度度量
6.5基于用戶興趣推薦
6.6“冷啟動”問題與混合策略
6.6.1冷啟動問題分析
6.6.2混合策略
第7章快銷行業(yè)客戶行為分析與流失預警
7.1業(yè)務背景分析
7.2數據預處理
7.2.1數據整理
7.2.2數據統(tǒng)計與探查
7.3用戶行為分析
7.3.1用戶流失風險評估
7.3.2流失風險預警模型集成
第8章基于深度學習的圖片識別系統(tǒng)
8.1業(yè)務背景分析
8.2圖片識別技術方案
8.3圖片預處理——表格旋轉
8.4圖片預處理——表格提取
8.5基于PaddlePaddle框架的文本識別
8.5.1環(huán)境安裝
8.5.2模型設計
8.5.3模型訓練
8.5.4模型使用
8.6基于密集卷積網絡的文本識別模型
8.6.1訓練數據生成
8.6.2DenseNet模型訓練
8.6.3文本識別模型調用
第9章超分辨率圖像重建
9.1數據探索
9.2數據預處理
9.2.1圖像尺寸調整
9.2.2載入數據
9.2.3圖像預處理
9.2.4持久化測試數據
9.3模型設計
9.3.1殘差塊
9.3.2上采樣 PixelShuffler
9.3.3生成器
9.3.4判別器
9.3.5損失函數與優(yōu)化器定義
9.3.6訓練過程
9.4實驗評估
第10章人類活動識別
10.1業(yè)務背景分析
10.2數據探索
10.3數據預處理
10.4模型構建
10.5模型評估
附錄機器學習復習題
參考文獻