注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計程序設計綜合文本挖掘與Python實踐

文本挖掘與Python實踐

文本挖掘與Python實踐

定 價:¥68.00

作 者: 劉金花
出版社: 四川大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787569045383 出版時間: 2021-08-01 包裝: 平裝
開本: 16開 頁數: 204 字數:  

內容簡介

  本書從文本數據具有的特點以及文本挖掘具有的價值和意義開始,講解了文本數據的獲取和預處理的方法(包括中英文的文本預處理),給出了文本向量化表示方法。本書從統(tǒng)計機器學習方法和深度神經網絡兩個角度,介紹了包括向量空間模型以及詞、句子和文檔級的分布式表示;針對文本分類問題,介紹了傳統(tǒng)文本分類方法、深度神經網絡分類方法(多層感知機文本分類、卷積神經網絡文本分類和循環(huán)神經網絡文本分類)和文本分類的評價指標;針對文本聚類,包括文檔相似度度量方法,介紹了基于劃分、層次、密度的基礎性聚類算法,以及譜聚類等高級聚類方法和文本聚類的評價指標;在理論學習的基礎上,介紹了文本主題的挖掘技術,包括潛在語義分析、非負矩陣分解、概率潛在語義分析和潛在狄利克雷分布等;最后從文本內容、主題和基于時間信息三個方面介紹了文本數據可視化的方法與工具。本書不僅對文本挖掘的相關理論模型進行了詳細的推理和全面介紹,而且在每個算法模型之后都會給出實例,在理論與實踐之間做了很好的平衡與銜接。

作者簡介

  劉金花,1987年生,碩士,山西醫(yī)科大學汾陽學院講師。主要研究方向為機器學習、數據挖掘。

圖書目錄

1 概述
1.1 文本數據
1.2 文本挖掘與分析
1.3 小結
2 數據獲取及預處理
2.1 數據獲取
2.2 數據清洗
2.3 數據預處理
2.4 N元語法模型
2.5 小結
3 文本向量化
3.1 向量空間模型
3.2 分布文本表示模型
3.3 句子向量化
3.4 文檔向量化
3.5 小結
4 文本分類
4.1 文本分類基礎
4.2 傳統(tǒng)文本分類算法
4.3 深度神經網絡方法
4.4 文本分類評價
4.5 小結
5 文本聚類
5.1 文本聚類基礎
5.2 基于劃分的聚類
5.3 基于層次的聚類
5.4 基于密度的聚類
5.5 譜聚類
5.6 文本聚類評價
5.7 小結
6 主題模型
6.1 潛在語義分析
6.2 非負矩陣分解(NMF)
6.3 概率潛在語義分析(PLSA)
6.4 潛在狄利克雷分布(LDA)
6.5 小結
7 文本數據可視化
7.1 文本內容可視化
7.2 文本主題可視化
7.3 基于時間信息的數據可視化
7.4 小結
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號