注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python自然語言處理(微課版)

Python自然語言處理(微課版)

Python自然語言處理(微課版)

定 價(jià):¥69.80

作 者: 周元哲 著
出版社: 清華大學(xué)出版社
叢編項(xiàng): 清華開發(fā)者書庫
標(biāo) 簽: 暫缺

ISBN: 9787302590699 出版時(shí)間: 2021-11-01 包裝: 平裝
開本: 16開 頁數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡介

  本書內(nèi)容包括自然語言處理概述、Python語言簡述、Python數(shù)據(jù)類型、Python流程控制、Python函數(shù)、Python數(shù)據(jù)科學(xué)、Sklearn和NLTK、語料清洗、特征工程、中文分詞、文本分類、文本聚類、評(píng)價(jià)指標(biāo)、信息提取和情感分析。附錄給出教學(xué)大綱。 本書采用基于Python語言的Sklearn平臺(tái)和NLTK實(shí)現(xiàn),便于學(xué)生更快地掌握自然語言處理的基本思想。實(shí)踐是最好的學(xué)習(xí)方法,本書的所有程序都在Anaconda下調(diào)試和運(yùn)行。本書配有源代碼、教學(xué)課件、語料集、教學(xué)大綱、程序安裝包、每章的視頻講解等資料。 本書內(nèi)容精練、文字簡潔、結(jié)構(gòu)合理,實(shí)訓(xùn)題目經(jīng)典實(shí)用、綜合性強(qiáng),面向初、中級(jí)讀者,由“入門”起步,側(cè)重“提高”。特別適合作為高等院校自然語言處理和機(jī)器學(xué)習(xí)入門的本科或研究生教材或參考書,也可以供從事人工智能等工作的技術(shù)人員應(yīng)用參考。

作者簡介

  周元哲,講師,1974年9月生,碩士。西安郵電學(xué)院從事計(jì)算機(jī)專業(yè)科研和教學(xué)。講授《 C程序設(shè)計(jì)語言》、《數(shù)據(jù)庫原理》、《visual Basic程序設(shè)計(jì)語言》、《軟件測(cè)試》《Python程序設(shè)計(jì)》《軟件工程》等課程。

圖書目錄

目錄


第1章自然語言處理概述1
1.1人工智能發(fā)展歷程1
1.1.1第一階段: 20年黃金時(shí)代1
1.1.2第二階段: 第一次寒冬1
1.1.3第三階段: 繁榮期1
1.1.4第四階段: 第二次寒冬2
1.1.5第五階段: 穩(wěn)健時(shí)代2
1.2自然語言處理2
1.2.1概述2
1.2.2發(fā)展歷程3
1.2.3處理流程4
1.2.4研究內(nèi)容4
1.3機(jī)器學(xué)習(xí)算法6
1.3.1監(jiān)督學(xué)習(xí)6
1.3.2無監(jiān)督學(xué)習(xí)7
1.4自然語言處理相關(guān)庫8
1.4.1NumPy8
1.4.2Matplotlib8
1.4.3Pandas8
1.4.4SciPy9
1.4.5NLTK9
1.4.6SnowNLP11
1.4.7Sklearn12
1.5語料庫12
1.5.1認(rèn)識(shí)語料庫12
1.5.2分類13
1.5.3構(gòu)建原則13
1.5.4常用語料庫13
1.5.5搜狗新聞?wù)Z料庫15第2章Python語言簡述19
2.1Python簡介19
2.1.1Python發(fā)展歷程19
2.1.2Python的特點(diǎn)19
2.1.3Python應(yīng)用場(chǎng)合20
2.2Python解釋器21
2.2.1Ubuntu下安裝Python21
2.2.2Windows下安裝Python21
2.3Python編輯器22
2.3.1IDLE22
2.3.2VS Code23
2.3.3PyCharm23
2.3.4Anaconda24
2.3.5Jupyter 31
2.4代碼書寫規(guī)則32
2.4.1縮進(jìn)32
2.4.2多行語句33
2.4.3注釋33
2.4.4編碼習(xí)慣33
2.5自學(xué)網(wǎng)站34
2.5.1菜鳥網(wǎng)站34
2.5.2廖雪峰學(xué)Python網(wǎng)站35
2.5.3Python官方網(wǎng)站35
2.5.4Python  100天從新手到大師網(wǎng)站35
第3章Python數(shù)據(jù)類型37
3.1變量37
3.1.1變量命名37
3.1.2變量引用38
3.2運(yùn)算符38
3.2.1算術(shù)運(yùn)算符38
3.2.2關(guān)系運(yùn)算符39
3.2.3賦值運(yùn)算符40
3.2.4邏輯運(yùn)算符41
3.2.5位運(yùn)算符41
3.2.6成員運(yùn)算符43
3.2.7身份運(yùn)算符43
3.3表達(dá)式43
3.3.1概念43
3.3.2操作44
3.4數(shù)據(jù)類型44
3.5數(shù)字45
3.5.1概念45
3.5.2操作45
3.6字符串46
3.6.1概念46
3.6.2操作46
3.7列表48
3.7.1概念48
3.7.2操作48
3.8元組53
3.8.1概念53
3.8.2操作54
3.9字典55
3.9.1字典的概念55
3.9.2字典操作56
3.9.3字典舉例59
3.10集合59
3.10.1集合的概念59
3.10.2集合操作60
3.10.3集合舉例61
3.11組合數(shù)據(jù)類型62
3.11.1相互關(guān)系62
3.11.2數(shù)據(jù)類型轉(zhuǎn)換62
第4章Python流程控制63
4.1流程結(jié)構(gòu)63
4.2順序結(jié)構(gòu)63
4.2.1輸入輸出64
4.2.2舉例67
4.3選擇結(jié)構(gòu)67
4.3.1單分支67
4.3.2雙分支68
4.3.3多分支69
4.3.4分支嵌套70
4.4循環(huán)概述72
4.4.1循環(huán)結(jié)構(gòu)72
4.4.2循環(huán)分類72
4.5while語句72
4.5.1基本形式72
4.5.2else 語句73
4.5.3無限循環(huán)74
4.6for語句74
4.6.1應(yīng)用序列類型74
4.6.2內(nèi)置函數(shù)range()75
4.7循環(huán)嵌套76
4.7.1原理76
4.7.2實(shí)現(xiàn)76
4.8輔助語句77
4.8.1break語句77
4.8.2continue語句79
4.8.3pass語句79
第5章Python函數(shù)81
5.1函數(shù)聲明與調(diào)用81
5.1.1函數(shù)聲明81
5.1.2函數(shù)調(diào)用81
5.1.3函數(shù)返回值83
5.2參數(shù)傳遞84
5.2.1實(shí)參與形參84
5.2.2傳對(duì)象引用84
5.3參數(shù)分類85
5.3.1必備參數(shù)85
5.3.2默認(rèn)參數(shù)85
5.3.3關(guān)鍵參數(shù)86
5.3.4不定長參數(shù)86
5.4兩類特殊函數(shù)87
5.4.1匿名函數(shù)87
5.4.2遞歸函數(shù)88
第6章Python數(shù)據(jù)科學(xué)93
6.1科學(xué)計(jì)算93
6.2NumPy94
6.2.1認(rèn)識(shí)NumPy94
6.2.2創(chuàng)建數(shù)組95
6.2.3查看數(shù)組97
6.2.4索引和切片97
6.2.5矩陣運(yùn)算98
6.3Matplotlib99
6.3.1認(rèn)識(shí)Matplotlib99
6.3.2線形圖100
6.3.3散點(diǎn)圖101
6.3.4餅狀圖102
6.3.5直方圖102
6.4Pandas103
6.4.1認(rèn)識(shí)Pandas103
6.4.2Series104
6.4.3DataFrame108
6.4.4Index112
6.4.5Plot114
6.5SciPy115
6.5.1認(rèn)識(shí)SciPy115
6.5.2稀疏矩陣115
6.5.3線性代數(shù)116
6.6Seaborn117
6.6.1認(rèn)識(shí)Seaborn117
6.6.2圖表分類119
第7章Sklearn和NLTK120
7.1Sklearn簡介120
7.2安裝Sklearn121
7.3數(shù)據(jù)集122
7.3.1小數(shù)據(jù)集122
7.3.2大數(shù)據(jù)集127
7.3.3生成數(shù)據(jù)集128
7.4機(jī)器學(xué)習(xí)流程132
7.4.1語料清洗132
7.4.2劃分?jǐn)?shù)據(jù)集132
7.4.3特征工程137
7.4.4機(jī)器算法137
7.4.5模型評(píng)估137
7.5NLTK簡介138
7.6NLTK語料庫139
7.6.1inaugural語料庫139
7.6.2gutenberg語料庫139
7.6.3movie_reviews語料庫140
7.7NLTK文本分類141
7.7.1分句分詞141
7.7.2停止詞142
7.7.3詞干提取143
7.7.4詞形還原143
7.7.5WordNet144
7.7.6語義相關(guān)性145
第8章語料清洗146
8.1認(rèn)識(shí)語料清洗146
8.2清洗策略147
8.2.1一致性檢查147
8.2.2格式內(nèi)容檢查147
8.2.3邏輯錯(cuò)誤檢查147
8.3缺失值清洗147
8.3.1認(rèn)識(shí)缺失值147
8.3.2Pandas處理148
8.3.3Sklearn處理150
8.4異常值清洗151
8.4.1散點(diǎn)圖方法151
8.4.2箱線圖方法151
8.4.33σ法則153
8.5重復(fù)值清洗155
8.5.1NumPy處理155
8.5.2Pandas處理155
8.6數(shù)據(jù)轉(zhuǎn)換157
8.6.1數(shù)據(jù)值替換157
8.6.2數(shù)據(jù)值映射158
8.6.3數(shù)據(jù)值合并159
8.6.4數(shù)據(jù)值補(bǔ)充160
8.7Missingno庫161
8.7.1認(rèn)識(shí)Missingno庫161
8.7.2示例163
8.8詞云165
8.8.1認(rèn)識(shí)詞云165
8.8.2示例166
第9章特征工程168
9.1特征預(yù)處理168
9.1.1歸一化168
9.1.2標(biāo)準(zhǔn)化169
9.1.3魯棒化171
9.1.4正則化171
9.1.5示例172
9.2獨(dú)熱編碼176
9.2.1認(rèn)識(shí)獨(dú)熱編碼176
9.2.2Pandas實(shí)現(xiàn)177
9.2.3Sklearn實(shí)現(xiàn)178
9.2.4DictVectorizer179
9.3CountVectorizer180
9.3.1認(rèn)識(shí)CountVectorizer180
9.3.2Sklearn調(diào)用CountVectorizer180
9.4TFIDF181
9.4.1認(rèn)識(shí)TFIDF181
9.4.2計(jì)算TFIDF181
9.4.3Sklearn調(diào)用TFIDF182
第10章中文分詞183
10.1概述183
10.1.1簡介183
10.1.2特點(diǎn)183
10.2常見中文分詞方法184
10.2.1基于規(guī)則和詞表方法184
10.2.2基于統(tǒng)計(jì)方法184
10.2.3基于理解方法185
10.3中文分詞困惑185
10.4jieba分詞庫186
10.4.1認(rèn)識(shí)jieba186
10.4.2三種模式187
10.4.3自定義詞典188
10.4.4詞性標(biāo)注189
10.4.5斷詞位置190
10.4.6關(guān)鍵詞抽取190
10.4.7停止詞表192
10.5HanLP分詞195
10.5.1認(rèn)識(shí)HanLP195
10.5.2pyhanlp196
10.5.3中文分詞196
10.5.4依存分析使用197
10.5.5關(guān)鍵詞提取198
10.5.6命名實(shí)體識(shí)別199
10.5.7自定義詞典199
10.5.8簡體繁體轉(zhuǎn)換200
10.5.9摘要提取200
第11章文本分類202
11.1歷史回顧202
11.2文本分類方法202
11.2.1樸素貝葉斯202
11.2.2支持向量機(jī)203
11.3貝葉斯定理203
11.4樸素貝葉斯204
11.4.1GaussianNB方法204
11.4.2MultinomialNB方法205
11.4.3BernoulliNB方法207
11.5樸素貝葉斯進(jìn)行新聞分類208
11.6支持向量機(jī)210
11.6.1線性核函數(shù)210
11.6.2多項(xiàng)式核函數(shù)211
11.6.3高斯核函數(shù)212
11.7支持向量機(jī)對(duì)鳶尾花分類213
11.8垃圾郵件分類216
11.8.1樸素貝葉斯定理實(shí)現(xiàn)217
11.8.2Sklearn樸素貝葉斯實(shí)現(xiàn)219
第12章文本聚類222
12.1概述222
12.1.1算法原理222
12.1.2流程223
12.2KMeans算法223
12.2.1算法原理223
12.2.2數(shù)學(xué)理論實(shí)現(xiàn)223
12.2.3Python實(shí)現(xiàn)225
12.3主成分分析228
12.3.1算法原理228
12.3.2components參數(shù)228
12.3.3對(duì)鳶尾花數(shù)據(jù)降維230
12.4KMeans評(píng)估指標(biāo)232
12.4.1調(diào)整蘭德系數(shù)232
12.4.2輪廓系數(shù)232
12.5KMeans英文文本聚類235
12.5.1構(gòu)建DataFrame數(shù)據(jù)236
12.5.2進(jìn)行分詞和停止詞去除236
12.5.3向量化236
12.5.4TFIDF模型236
12.5.5計(jì)算余弦相似度237
12.5.6KMeans聚類237
12.6KMeans中文文本聚類237
12.6.1程序流程237
12.6.2程序文件238
12.6.3執(zhí)行代碼238
第13章評(píng)價(jià)指標(biāo)242
13.1Sklearn中的評(píng)價(jià)指標(biāo)242
13.2混淆矩陣242
13.2.1認(rèn)識(shí)混淆矩陣242
13.2.2Pandas計(jì)算混淆矩陣243
13.2.3Sklearn計(jì)算混淆矩陣244
13.3準(zhǔn)確率244
13.3.1認(rèn)識(shí)準(zhǔn)確率244
13.3.2Sklearn計(jì)算準(zhǔn)確率245
13.4精確率245
13.4.1認(rèn)識(shí)精確率245
13.4.2Sklearn計(jì)算精確率245
13.5召回率246
13.5.1認(rèn)識(shí)召回率246
13.5.2Sklearn計(jì)算召回率246
13.6F1 Score247
13.6.1認(rèn)識(shí)F1 Score247
13.6.2Sklearn計(jì)算F1 Score247
13.7綜合實(shí)例247
13.7.1數(shù)學(xué)計(jì)算評(píng)價(jià)指標(biāo)248
13.7.2Python計(jì)算評(píng)價(jià)指標(biāo)248
13.8ROC曲線250
13.8.1認(rèn)識(shí)ROC曲線250
13.8.2Sklearn計(jì)算ROC曲線251
13.9AUC面積252
13.9.1認(rèn)識(shí)AUC面積252
13.9.2Sklearn計(jì)算AUC面積252
13.10分類評(píng)估報(bào)告253
13.10.1認(rèn)識(shí)分類評(píng)估報(bào)告253
13.10.2Sklearn計(jì)算分類評(píng)估報(bào)告253
13.11NLP評(píng)價(jià)指標(biāo)254
13.11.1中文分詞精確率和召回率254
13.11.2未登錄詞和登錄詞召回率254
第14章信息提取258
14.1概述258
14.2相關(guān)概念258
14.2.1信息258
14.2.2信息熵258
14.2.3信息熵與霍夫曼編碼259
14.2.4互信息260
14.3正則表達(dá)式260
14.3.1基本語法261
14.3.2re模塊261
14.3.3提取電影信息264
14.4命名實(shí)體識(shí)別266
14.4.1認(rèn)識(shí)命名實(shí)體266
14.4.2常見方法266
14.4.3NLTK命名實(shí)體識(shí)別267
14.4.4Stanford NLP命名實(shí)體識(shí)別269
14.5馬爾可夫模型273
14.5.1認(rèn)識(shí)馬爾可夫273
14.5.2隱馬爾可夫模型273
第15章情感分析275
15.1概述275
15.1.1認(rèn)識(shí)情感分析275
15.1.2基于詞典方法275
15.2情感傾向分析276
15.2.1情感詞276
15.2.2程度詞276
15.2.3感嘆號(hào)276
15.2.4否定詞276
15.3textblob276
15.3.1分句分詞278
15.3.2詞性標(biāo)注278
15.3.3情感分析279
15.3.4單復(fù)數(shù)279
15.3.5過去式279
15.3.6拼寫校正280
15.3.7詞頻統(tǒng)計(jì)280
15.4SnowNLP280
15.4.1分詞281
15.4.2詞性標(biāo)注281
15.4.3斷句281
15.4.4情緒判斷282
15.4.5拼音282
15.4.6繁轉(zhuǎn)簡283
15.4.7關(guān)鍵字抽取283
15.4.8摘要抽取283
15.4.9詞頻和逆文檔詞頻284
15.5Gensim284
15.5.1認(rèn)識(shí)Gensim284
15.5.2認(rèn)識(shí)LDA286
15.5.3Gensim實(shí)現(xiàn)LDA286
15.6小說人物情感分析288
15.6.1流程288
15.6.2代碼288
15.7電影影評(píng)情感分析289
15.7.1流程289
15.7.2代碼289
附錄A教學(xué)大綱292
一、 課程簡介292
二、 課程內(nèi)容及要求292
三、 教學(xué)安排及學(xué)時(shí)分配298
四、 考核方式299
五、 建議教材及參考文獻(xiàn)299
參考文獻(xiàn)300

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)