注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術自然科學自然科學總論雙語語料構建與雙語文本聚類研究

雙語語料構建與雙語文本聚類研究

雙語語料構建與雙語文本聚類研究

定 價:¥50.00

作 者: 章成志
出版社: 南京大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787305223785 出版時間: 2019-06-01 包裝:
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  《雙語語料構建與雙語文本聚類研究》以多語言文本為研究對象,進行基于多語言文本的文本挖掘,涉及任務主要分為三塊內(nèi)容,多語言文本的采集,其中包括了平行語料和可比語料,對多語言語料的評估以及多語言文本的聚類。其中,多語言文本的聚類研究中,針對多語言文本的關鍵詞抽取、平行語料和可比語料的文本聚類進行了相關實驗。任務中主要針對中英文語料進行相關挖掘,實驗中使用的研究方法具有普適性,可以運用到其他語種的文本挖掘中。

作者簡介

暫缺《雙語語料構建與雙語文本聚類研究》作者簡介

圖書目錄

第1章 緒論
1.1 研究背景
1.2 研究意義
1.3 研究內(nèi)容框架
1.4 本書章節(jié)安排
第2章 相關研究工作綜述
2.1 雙語語料采集研究綜述
2.1.1 基于網(wǎng)絡資源的可比語料采集
2.1.2 基于平行網(wǎng)頁的平行語料采集
2.2 可比語料評估研究綜述
2.2.1 可比語料的可比度度量
2.2.2 跨語言文檔相似度計算
2.3 多語言文本關鍵詞抽取研究綜述
2.3.1 候選關鍵詞的選取
2.3.2 有監(jiān)督的關鍵詞抽取方法
2.3.3 無監(jiān)督的關鍵詞抽取方法
2.4 多語言文本聚類研究綜述
2.4.1 文本表示模型
2.4.2 文本聚類算法
2.4.3 多語言文本聚類
第3章 雙語語料采集與構建研究
3.1 雙語平行網(wǎng)頁發(fā)現(xiàn)
3.1.1 總體流程與關鍵技術
3.1.2 網(wǎng)頁結果評估與分析
3.2 雙語可比語料構建
3.2.1 總體流程與關鍵技術
3.2.2 可比語料構建結果與分析
3.3 本章小結
第4章 雙語可比語料評估研究
4.1 可比語料可比度度量
4.1.1 總體流程與關鍵技術
4.1.2 可比度度量結果與分析
4.2 可比語料的評估
4.2.1 總體流程與關鍵技術
4.2.2 語料評估結果與分析
4.3 本章小結
第5章 雙語文本關鍵詞挖掘研究
5.1 關鍵詞分布特點分析
5.1.1 中文關鍵詞分布特點分析
5.1.2 英文關鍵詞分布特點分析
5.2 關鍵詞抽取方法思路與關鍵技術
5.2.1 關鍵詞抽取總體流程
5.2.2 關鍵詞抽取中的特征計算方法
5.3 實驗與結果分析
5.3.1 特征歸一化與結果評價
5.3.2 中文關鍵詞抽取實驗結果
5.3.3 英文關鍵詞抽取實驗結果
5.4 本章小結
第6章 雙語文本聚類研究
6.1 平行語料聚類研究
6.1.1 平行語料聚類的總體流程
6.1.2 中英文平行語料聚類的關鍵技術
6.1.3 文本聚類結果與分析
6.2 可比語料聚類研究
6.2.1 可比語料聚類的總體流程
6.2.2 中英文可比語料聚類的關鍵技術
6.2.3 文本聚類結果與分析
6.3 本章小結
第7章 結束語
7.1 總結
7.2 未來研究工作
7.2.1 雙語語料采集與構建
7.2.2 雙語可比語料評估
7.2.3 雙語文本關鍵詞抽取與雙語文本聚類
附錄
附錄A 基于搜索引擎方法采集可比語料的種子詞對示例
附錄B Wikipedia可比語料采集種子詞樣例
附錄C Wikipedia可比語料中的對齊標題(部分)
附錄D 圖情核心期刊在CNKI(19982011)中的檢索結果
附錄E 圖書情報期刊在EBSCO數(shù)據(jù)庫中檢索和下載情況
附錄F 基于傳統(tǒng)統(tǒng)計和詞頻統(tǒng)計的語料相似度結果
附錄G 基于術語度的可比語料與其他領域語料比較結果
參考文獻
索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號