注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書人文社科哲學心理學主題聚類及其應用研究

主題聚類及其應用研究

主題聚類及其應用研究

定 價:¥48.00

作 者: 章成志 著
出版社: 北京圖書館出版社
叢編項:
標 簽: 社會科學 圖書館學 圖書館學/檔案學

購買這本書可以去


ISBN: 9787501349296 出版時間: 2013-04-01 包裝: 平裝
開本: 16開 頁數(shù): 178 字數(shù):  

內(nèi)容簡介

  《主題聚類及其應用研究》對主題聚類理論、方法、若干關(guān)鍵技術(shù)以及應用進行了全面的研究,主要內(nèi)容包括:自動標引的研究歷史、研究方法,并利用當前先進的機器統(tǒng)計系學習模型進行了自動標引的實驗研究、提出自動標引的通用評價模型等;對主題聚類中的相似度計算、樣本加權(quán)聚類方法、聚類結(jié)果的描述進行了詳細的描述和實驗論證,并進行了測評;基于主題聚類方法,進行主題數(shù)字圖書館構(gòu)建、學科熱點檢測等方面的應用。

作者簡介

  章成志,男,1977年生,博士,現(xiàn)為南京理工大學信息管理系副研究員、博士生導師,南京理工大學卓越計劃“紫金之星”與創(chuàng)新團隊成員。2007畢業(yè)于南京大學情報學專業(yè),獲管理學博士學位。2007年至2009年,在中國科學技術(shù)信息研究所從事多語言領(lǐng)域本體自動構(gòu)建的博士后研究工作。2010年至2011年,在香港城市大學訪問,從事平行語料采集與挖掘的研究工作。近年來在國內(nèi)外期刊和會議上發(fā)表學術(shù)論文50余篇,出版專著兩部。研究領(lǐng)域主要包括信息組織、信息檢索、文本挖掘及自然語言處理等,近期主要的研究方向為社會化標簽系統(tǒng)挖掘、多語言文本挖掘、多語言領(lǐng)域本體學習等。曾參與或主持的項目包括“十一五”國家科技支撐計劃重點項目子課題、國家自然科學基金項目、國家社科基金項目、教育部人文社科項目、中國博士后科學基金特別資助項目、中國博士后科學基金面上資助項目等。

圖書目錄

第1章 引言
1.1 研究背景
1.2 研究意義
1.3 主題聚類研究中存在的問題與解決方法
1.4 本書內(nèi)容安排
參考文獻

第2章 主題聚類研究概述
2.1 主題提取研究概述
2.2 不同對象的聚類方法研究概述
參考文獻

第3章 自動標引通用評價模型研究
3.1 自動標引結(jié)果評價概述
3.2 一種通用的自動標引評價模型
3.3 自動標引評價模型的應用與性能分析
3.4 本章小結(jié)
參考文獻

第4章 基于機器學習的主題提取研究
4.1 關(guān)鍵詞類型分析
4.2 幾個對照的標引模型
4.3 基于CRF的關(guān)鍵詞提取方法
4.4 基于集成學習的自動標引方法
4.5 基于Citation-KNN的自動賦詞標引方法
4.6 本章小結(jié)
參考文獻

第5章 主題聚類中聚類對象相似度計算研究
5.1 基于多層特征的字符串相似度模型
5.2 基于多語境的查詢式相似度計算模型
5.3 本章小結(jié)
參考文獻

第6章 基于樣本加權(quán)的文本聚類研究
6.1 基于樣本加權(quán)的文本聚類算法
6.2 基于主題聚類的主題數(shù)字圖書館
6.3 基于主題聚類的學科熱點檢測
6.4 本章小結(jié)
參考文獻

第7章 文本聚類結(jié)果描述算法研究
7.1 文本聚類結(jié)果描述研究概述
7.2 聚類描述要求、形式化及評價方法
7.3 基于機器學習的聚類描述算法
7.4 基于DCF-DCL組合策略的聚類描述算法
7.5 基于主題的搜索結(jié)果聚類
7.6 本章小結(jié)
參考文獻

第8章 結(jié)束語
8.1 總結(jié)
8.2 進一步的研究工作

附錄1 Segag漢語文本詞性標注標記集
附錄2 SVMlight自動標引訓練集樣例
附錄3 CRF++自動標引訓練集樣例
附錄4 用于自動標引的CRF++特征模板
附錄5 測試集自動標引結(jié)果樣例
附錄6 相關(guān)詞提取結(jié)果樣例(整合后)
附錄7 文本的引用頻次與Pagerank值樣例(金融類)
附錄8 文本聚類后的類簇中心向量(煤炭類)
附錄9 主題數(shù)字圖書館聚類結(jié)果導航樣例
附錄10 學科熱點檢測結(jié)果顯示(圖書情報檔案類)
附錄11 SVMlight聚類描述訓練集樣例
附錄12 基于主題的搜索結(jié)果聚類樣例
索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號