定 價:¥59.00
作 者: | (印度)克里希納·巴夫薩,(印度)納雷什·庫馬爾 等 |
出版社: | 機械工業(yè)出版社 |
叢編項: | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787111616436 | 出版時間: | 2019-02-01 | 包裝: | 平裝 |
開本: | 16開 | 頁數(shù): | 字?jǐn)?shù): |
譯者序
前言
作者簡介
審校者簡介
第1章 語料庫和WordNet 1
1.1 引言 1
1.2 訪問內(nèi)置語料庫 1
1.3 下載外部語料庫,加載并訪問 3
1.4 計算布朗語料庫中三種不同類別的特殊疑問詞 5
1.5 探討網(wǎng)絡(luò)文本和聊天文本的詞頻分布 7
1.6 使用WordNet進(jìn)行詞義消歧 9
1.7 選擇兩個不同的同義詞集,使用WordNet探討上位詞和下位詞的概念 12
1.8 基于WordNet計算名詞、動詞、形容詞和副詞的平均多義性 15
第2章 針對原始文本,獲取源數(shù)據(jù)和規(guī)范化 17
2.1 引言 17
2.2 字符串操作的重要性 17
2.3 深入實踐字符串操作 19
2.4 在Python中讀取PDF文件 21
2.5 在Python中讀取Word文件 23
2.6 使用PDF、DOCX和純文本文件,創(chuàng)建用戶自定義的語料庫 26
2.7 讀取RSS信息源的內(nèi)容 29
2.8 使用BeautifulSoup解析HTML 31
第3章 預(yù)處理 34
3.1 引言 34
3.2 分詞——學(xué)習(xí)使用NLTK內(nèi)置的分詞器 34
3.3 詞干提取——學(xué)習(xí)使用NLTK內(nèi)置的詞干提取器 36
3.4 詞形還原——學(xué)習(xí)使用NLTK中的WordnetLemmatizer函數(shù) 38
3.5 停用詞——學(xué)習(xí)使用停用詞語料庫及其應(yīng)用 40
3.6 編輯距離——編寫計算兩個字符串之間編輯距離的算法 42
3.7 處理兩篇短文并提取共有詞匯 44
第4章 正則表達(dá)式 50
4.1 引言 50
4.2 正則表達(dá)式——學(xué)習(xí)使用*、 和? 50
4.3 正則表達(dá)式——學(xué)習(xí)使用$和^,以及如何在單詞內(nèi)部(非開頭與結(jié)尾處)進(jìn)行模式匹配 52
4.4 匹配多個字符串和子字符串 54
4.5 學(xué)習(xí)創(chuàng)建日期正則表達(dá)式和一組字符集合或字符范圍 56
4.6 查找句子中所有長度為5的單詞,并進(jìn)行縮寫 58
4.7 學(xué)習(xí)編寫基于正則表達(dá)式的分詞器 59
4.8 學(xué)習(xí)編寫基于正則表達(dá)式的詞干提取器 60
第5章 詞性標(biāo)注和文法 63
5.1 引言 63
5.2 使用內(nèi)置的詞性標(biāo)注器 63
5.3 編寫你的詞性標(biāo)注器 65
5.4 訓(xùn)練你的詞性標(biāo)注器 70
5.5 學(xué)習(xí)編寫你的文法 73
5.6 編寫基于概率的上下文無關(guān)文法 76
5.7 編寫遞歸的上下文無關(guān)文法 79
第6章 分塊、句法分析、依存分析 82
6.1 引言 82
6.2 使用內(nèi)置的分塊器 82
6.3 編寫你的簡單分塊器 84
6.4 訓(xùn)練分塊器 87
6.5 遞歸下降句法分析 90
6.6 shift-reduce句法分析 93
6.7 依存句法分析和主觀依存分析 95
6.8 線圖句法分析 97
第7章 信息抽取和文本分類 101
7.1 引言 101
7.2 使用內(nèi)置的命名實體識別工具 102
7.3 創(chuàng)建字典、逆序字典和使用字典 104
7.4 特征集合選擇 109
7.5 利用分類器分割句子 113
7.6 文本分類 116
7.7 利用上下文進(jìn)行詞性標(biāo)注 120
第8章 高階自然語言處理實踐 124
8.1 引言 124
8.2 創(chuàng)建一條自然語言處理管道 124
8.3 解決文本相似度問題 131
8.4 主題識別 136
8.5 文本摘要 140
8.6 指代消解 143
8.7 詞義消歧 147
8.8 情感分析 150
8.9 高階情感分析 153
8.10 創(chuàng)建一個對話助手或聊天機器人 157
第9章 深度學(xué)習(xí)在自然語言處理中的應(yīng)用 163
9.1 引言 163
9.2 利用深度神經(jīng)網(wǎng)絡(luò)對電子郵件進(jìn)行分類 168
9.3 使用一維卷積網(wǎng)絡(luò)進(jìn)行IMDB情感分類 175
9.4 基于雙向LSTM的IMDB情感分類模型 179
9.5 利用詞向量實現(xiàn)高維詞在二維空間的可視化 183
第10章 深度學(xué)習(xí)在自然語言處理中的高級應(yīng)用 188
10.1 引言 188
10.2 基于莎士比亞的著作使用LSTM技術(shù)自動生成文本 188
10.3 基于記憶網(wǎng)絡(luò)的情景數(shù)據(jù)問答 193
10.4 使用循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM進(jìn)行語言建模以預(yù)測最優(yōu)詞 199
10.5 使用循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM構(gòu)建生成式聊天機器人 203