注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術一般工業(yè)技術實體識別關鍵技術的研究

實體識別關鍵技術的研究

實體識別關鍵技術的研究

定 價:¥48.00

作 者: 黎玲利
出版社: 哈爾濱工業(yè)大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787576709254 出版時間: 2023-08-01 包裝: 平裝
開本: 16開 頁數: 118 字數:  

內容簡介

  實體識別在數據質量管理中起著重要作用,它是數據質量管理的重要研究方向。實體識別的目的是識別出數據集中描述同一真實世界實體的元組。實體識別的結果可以在數據質量管理的其他階段(如數據清洗階段和數據質量評估階段)得到廣泛應用。在一個或多個數據庫中,同一個現實世界實體可能具有多種描述方式,這一問題在各種應用領域的信息系統(tǒng)中普遍存在。本書以信息集成和互聯網搜索為背景,介紹對數據質量管理中實體識別的關鍵技術的 研究成果,以 化實體識別結果 度、 小化時間復雜性為目標,研究基于圖模型的實體識別、基于規(guī)則的實體識別、基于距離度量的實體識別和對冗余元組中實體描述的沖突評估。本書可作為科研機構數據質量管理方面的參考用書。

作者簡介

暫缺《實體識別關鍵技術的研究》作者簡介

圖書目錄

第1章 緒論
1.1 研究背景
1.2 研究現狀及分析
1.3 本書的研究內容
第2章 基于圖模型的實體識別
2.1 引言
2.2 基于圖模型的實體識別框架
2.3 基于EIF的作者識別算法
2.4 實驗評估
2.5 本章小結
第3章 基于規(guī)則的實體識別
3.1 引言
3.2 實體識別規(guī)則
3.3 實體識別規(guī)則的發(fā)現
3.4 基于規(guī)則的實體識別
3.5 規(guī)則的 新
3.6 實驗評估
3.7 本章小結
第4章 基于距離度量的實體識別
4.1 引言
4.2 背景介紹
4.3 實體識別的度量學習
4.4 基于距離度量的實體識別
4.5 實驗評估
4.6 本章小結
第5章 對冗余元組中實體描述的沖突評估
5.1 引言
5.2 實體描述沖突模型
5.3 edc范圍計算問題
5.4 edc范圍計算框架
5.5 實驗評估
5.6 本章小結
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號