注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件非結(jié)構(gòu)化大數(shù)據(jù)分析

非結(jié)構(gòu)化大數(shù)據(jù)分析

非結(jié)構(gòu)化大數(shù)據(jù)分析

定 價(jià):¥36.00

作 者: 李翠平 編
出版社: 中國(guó)人民大學(xué)出版社
叢編項(xiàng): 大數(shù)據(jù)分析統(tǒng)計(jì)應(yīng)用叢書
標(biāo) 簽: 暫缺

ISBN: 9787300262970 出版時(shí)間: 2018-11-01 包裝: 平裝
開本: 16開 頁數(shù): 225 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《非結(jié)構(gòu)化大數(shù)據(jù)分析/大數(shù)據(jù)分析統(tǒng)計(jì)應(yīng)用叢書》介紹了四種典型非結(jié)構(gòu)化數(shù)據(jù)的分析和挖掘技術(shù),分別是文本數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)、數(shù)據(jù)流數(shù)據(jù)和多媒體數(shù)據(jù)(包括圖像、音頻和視頻),共12章?!斗墙Y(jié)構(gòu)化大數(shù)據(jù)分析/大數(shù)據(jù)分析統(tǒng)計(jì)應(yīng)用叢書》第1~5章,主要介紹了文本挖掘的時(shí)代背景、文本挖掘與數(shù)據(jù)挖據(jù)的關(guān)系、文本預(yù)處理、文本分類、文本聚類、話題檢測(cè)、觀點(diǎn)挖掘和情感分析等。第6~10章,主要介紹了社會(huì)網(wǎng)絡(luò)的相關(guān)基本概念、常見統(tǒng)計(jì)屬性、社區(qū)發(fā)現(xiàn)、個(gè)體社會(huì)影響力分析、鏈路預(yù)測(cè)、網(wǎng)絡(luò)信息擴(kuò)散等。第11章,主要介紹了數(shù)據(jù)流中的變化探測(cè)、直方圖、聚類和分類等。第12章,主要介紹了圖像、音頻和視頻數(shù)據(jù)的特征提取、內(nèi)容檢索、內(nèi)容識(shí)別等。

作者簡(jiǎn)介

  李翠平,女,教授,中國(guó)人民大學(xué)信息學(xué)院副院長(zhǎng)、計(jì)算機(jī)系主任,中國(guó)計(jì)算機(jī)學(xué)會(huì)杰出會(huì)員,大數(shù)據(jù)專家委員會(huì)常務(wù)委員,數(shù)據(jù)庫專委會(huì)委員。2003年畢業(yè)于中科院計(jì)算所獲得博士學(xué)位,2008年在美國(guó)UIUC大學(xué)計(jì)算機(jī)系訪問交流。目前研究方向?yàn)閿?shù)據(jù)倉(cāng)庫、數(shù)據(jù)挖掘、社會(huì)網(wǎng)絡(luò)分析和社會(huì)媒體推薦等。主持和參與國(guó)家重點(diǎn)研發(fā)計(jì)劃課題、自然科學(xué)基金、973、863等10多項(xiàng)***和省部級(jí)項(xiàng)目,先后在SIGKDD、SIGMOD、VLDB、EDBT等重要國(guó)際會(huì)議和TKDE、KAIS、JCST、軟件學(xué)報(bào)等國(guó)內(nèi)外期刊發(fā)表論文100多篇,出版著作2部,申請(qǐng)國(guó)家發(fā)明專利4項(xiàng),獲得軟件著作權(quán)登記2項(xiàng)。2007年入選北京****優(yōu)秀人才培養(yǎng)資助計(jì)劃。2009年入選教育部新世紀(jì)優(yōu)秀人才支持計(jì)劃。2011年獲得中國(guó)計(jì)算機(jī)學(xué)會(huì)“青年科學(xué)家獎(jiǎng)”。

圖書目錄

第1章 文本挖掘概述
1.1 時(shí)代背景
1.2 文本挖掘與數(shù)據(jù)挖掘
第2章 文本預(yù)處理
2.1 自然語言處理
2.2 分詞技術(shù)
2.3 文本表示
第3章 文本分類
3.1 預(yù)測(cè)建模
3.2 決策樹分類
3.3 貝葉斯分類
3.4 支持向量機(jī)分類
3.5 實(shí)踐案例———垃圾短信識(shí)別
第4章 文本聚類和話題檢測(cè)
4.1 概述
4.2 基于相似度的文本聚類
4.3 基于模型的文本聚類
4.4 實(shí)踐案例———用LDA實(shí)現(xiàn)話題檢測(cè)
第5章 情感分析和觀點(diǎn)挖掘
5.1 概述
5.2 問題定義
5.3 文檔級(jí)情感分析
5.4 句子級(jí)情感分析
5.5 方面級(jí)情感分析
5.6 存在的問題和挑戰(zhàn)
5.7 實(shí)踐案例———發(fā)債企業(yè)負(fù)面新聞識(shí)別系統(tǒng)
第6章 社交網(wǎng)絡(luò)及其統(tǒng)計(jì)特性
6.1 社交網(wǎng)絡(luò)簡(jiǎn)介
6.2 相關(guān)基本概念
6.3 常見統(tǒng)計(jì)特性
6.4 實(shí)踐案例———微博用戶關(guān)系分析
第7章 社區(qū)發(fā)現(xiàn)
7.1 概述
7.2 社區(qū)發(fā)現(xiàn)方法
7.3 社區(qū)發(fā)現(xiàn)相關(guān)的研究領(lǐng)域
7.4 實(shí)踐案例———用邊聚類探測(cè)算法發(fā)現(xiàn)社區(qū)
第8章 個(gè)體社會(huì)影響力分析
8.1 概述
8.2 個(gè)體社會(huì)影響力及影響強(qiáng)度度量
8.3 實(shí)踐案例———用PageRank算法計(jì)算個(gè)體社會(huì)影響力
第9章 鏈路預(yù)測(cè)
9.1 簡(jiǎn)介
9.2 基于相似度的鏈路預(yù)測(cè)算法
9.3 基于等級(jí)結(jié)構(gòu)模型的鏈路預(yù)測(cè)算法
9.4 實(shí)踐案例———鏈路預(yù)測(cè)
第10章 網(wǎng)絡(luò)信息擴(kuò)散
10.1 熱點(diǎn)主題的發(fā)現(xiàn)方法
10.2 信息擴(kuò)散過程的建模與分析
10.3 實(shí)踐案例———信息擴(kuò)散計(jì)算過程
第11章 數(shù)據(jù)流中的數(shù)據(jù)挖掘
11.1 簡(jiǎn)介
11.2 數(shù)據(jù)流中的變化探測(cè)
11.3 實(shí)時(shí)更新數(shù)據(jù)流中的直方圖
11.4 數(shù)據(jù)流中的聚類
11.5 數(shù)據(jù)流的分類
11.6 數(shù)據(jù)流方法的評(píng)估
第12章 多媒體數(shù)據(jù)分析
12.1 概述
12.2 基礎(chǔ)知識(shí)
12.3 特征提取
12.4 多媒體內(nèi)容檢索
12.5 多媒體內(nèi)容識(shí)別
12.6 國(guó)際評(píng)測(cè)
12.7 問題與挑戰(zhàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)