注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python社會(huì)媒體挖掘

Python社會(huì)媒體挖掘

Python社會(huì)媒體挖掘

定 價(jià):¥69.00

作 者: [意] 馬爾科·邦扎尼尼(Marco Bonzanini) 著,陳小莉,陶俊杰 譯
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787115494016 出版時(shí)間: 2018-10-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 229 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書共分為9章,從社會(huì)媒體API、數(shù)據(jù)挖掘技巧和Python的數(shù)據(jù)科學(xué)工具這3個(gè)主題進(jìn)行闡釋。主要內(nèi)容包括:如何用Python通過(guò)公共API與社會(huì)媒體平臺(tái)交互,如何以方便的格式為數(shù)據(jù)分析存儲(chǔ)社會(huì)媒體數(shù)據(jù),如何使用Python數(shù)據(jù)科學(xué)工具分割社會(huì)媒體數(shù)據(jù),如何用文本分析方法理解社會(huì)媒體數(shù)據(jù),如何用先進(jìn)的統(tǒng)計(jì)和分析手段從海量數(shù)據(jù)中挖掘出有用信息,以及如何用Web技術(shù)來(lái)可視化數(shù)據(jù)。

作者簡(jiǎn)介

  馬爾科·邦扎尼尼(Marco Bonzanini) 數(shù)據(jù)科學(xué)咨詢師,擁有倫敦瑪麗王后大學(xué)信息檢索專業(yè)博士學(xué)位,是PyData倫敦meetup及系列會(huì)議的合作組織者,在很多國(guó)際會(huì)議上做過(guò)演講,并且在PacktPub上教授“Python數(shù)據(jù)分析”和“實(shí)用Python數(shù)據(jù)科學(xué)技術(shù)”兩門課程。他在個(gè)人博上分享了很多技術(shù)主題,主要關(guān)于Python、文本分析和數(shù)據(jù)科學(xué)。

圖書目錄

第 1章 社會(huì)媒體、社交數(shù)據(jù)和Python  1
1.1 入門 1
1.2 社會(huì)媒體——機(jī)遇和挑戰(zhàn) 2
1.2.1 機(jī)遇 3
1.2.2 挑戰(zhàn) 4
1.2.3 社會(huì)媒體挖掘技術(shù) 7
1.3 Python的數(shù)據(jù)科學(xué)工具 10
1.3.1 Python開發(fā)環(huán)境的安裝 11
1.3.2 高效的數(shù)據(jù)分析 14
1.3.3 機(jī)器學(xué)習(xí) 17
1.3.4 自然語(yǔ)言處理 21
1.3.5 社會(huì)網(wǎng)絡(luò)分析 25
1.3.6 數(shù)據(jù)可視化 26
1.4 Python中的數(shù)據(jù)處理 28
1.5 創(chuàng)建復(fù)雜的數(shù)據(jù)管道 29
1.6 小結(jié) 30
第 2章 Twitter數(shù)據(jù)挖掘——標(biāo)簽、話題和時(shí)間序列 31
2.1 入門 31
2.2 Twitter API 32
2.2.1 接口訪問頻率限制 32
2.2.2 搜索與流 33
2.3 從Twitter收集數(shù)據(jù) 34
2.3.1 從時(shí)間線獲取推文 35
2.3.2 推文的結(jié)構(gòu) 38
2.3.3 使用流API 42
2.4 分析推文——實(shí)體分析 44
2.5 分析推文——文本分析 48
2.6 分析推文——時(shí)間序列分析 54
2.7 小結(jié) 57
第3章 Twitter用戶、粉絲和社區(qū) 58
3.1 用戶、好友和粉絲 58
3.1.1 回到Twitter API 58
3.1.2 用戶資料的結(jié)構(gòu) 59
3.1.3 下載好友和粉絲的資料 62
3.1.4 分析你的社會(huì)網(wǎng)絡(luò) 64
3.1.5 度量影響力和參與度 68
3.2 挖掘粉絲 72
3.3 挖掘?qū)υ挕?7
3.4 在地圖上繪制推文 80
3.4.1 將推文轉(zhuǎn)換為GeoJSON 80
3.4.2 用Folium輕松繪制地圖 83
3.5 小結(jié) 89
第4章 Facebook帖子、頁(yè)面和用戶互動(dòng) 90
4.1 Facebook Graph API 90
4.1.1 注冊(cè)你的應(yīng)用 90
4.1.2 鑒權(quán)和安全 92
4.1.3 用Python連接Facebook Graph API 93
4.2 挖掘你的帖子 96
4.2.1 帖子的結(jié)構(gòu) 99
4.2.2 時(shí)間頻率分析 99
4.3 挖掘Facebook頁(yè)面 101
4.3.1 從頁(yè)面獲取帖子 103
4.3.2 度量參與度 107
4.3.3 用詞云可視化帖子 112
4.4 小結(jié) 114
第5章 Google+話題分析 115
5.1 Google+ API入門 115
5.2 在Web GUI中嵌入搜索結(jié)果 120
5.2.1 Python的裝飾器 121
5.2.2 Flask路由和模板 122
5.3 Google+頁(yè)面的筆記和活動(dòng) 125
5.4 筆記的文本分析和TF-IDF計(jì)算 127
5.5 小結(jié) 134
第6章 Stack Exchange提問和回答 135
6.1 提問和回答 135
6.2 Stack Exchange API入門 137
6.2.1 搜索帶標(biāo)簽的問題 139
6.2.2 搜索用戶 142
6.3 處理Stack Exchange的存檔數(shù)據(jù) 144
6.4 問題標(biāo)簽的文本分類 149
6.4.1 監(jiān)督學(xué)習(xí)和文本分類 149
6.4.2 分類算法 153
6.4.3 評(píng)估 155
6.4.4 Stack Exchange數(shù)據(jù)的文本分類 157
6.4.5 在實(shí)時(shí)應(yīng)用中嵌入分類器 161
6.5 小結(jié) 165
第7章 博客、RSS、維基百科和自然語(yǔ)言處理 166
7.1 博客和自然語(yǔ)言處理 166
7.2 從博客和網(wǎng)站獲取數(shù)據(jù) 166
7.2.1 使用WordPress.com API 167
7.2.2 使用Blogger API 170
7.2.3 解析RSS和Atom訂閱 173
7.2.4 從維基百科獲取數(shù)據(jù) 174
7.2.5 關(guān)于網(wǎng)絡(luò)爬取的一點(diǎn)建議 176
7.3 自然語(yǔ)言處理基礎(chǔ) 177
7.3.1 文本處理 177
7.3.2 信息抽取 185
7.4 小結(jié) 190
第8章 挖掘所有數(shù)據(jù) 191
8.1 很多社交API 191
8.2 挖掘YouTube上的視頻 191
8.3 挖掘GitHub上的開源軟件 196
8.4 挖掘Yelp上的本地商家 203
8.5 創(chuàng)建自定義的Python客戶端 208
8.6 小結(jié) 210
第9章 關(guān)聯(lián)數(shù)據(jù)和語(yǔ)義網(wǎng) 211
9.1 數(shù)據(jù)網(wǎng) 211
9.1.1 語(yǔ)義網(wǎng)詞匯 212
9.1.2 微格式 215
9.1.3 關(guān)聯(lián)數(shù)據(jù)和開放數(shù)據(jù) 216
9.1.4 RDF 217
9.1.5 JSON-LD格式 218
9.1.6 Schema.org 219
9.2 從DBpedia挖掘關(guān)系 220
9.3 挖掘地理坐標(biāo) 222
9.3.1 從維基百科抽取地理數(shù)據(jù) 222
9.3.2 在Google Maps上繪制地理數(shù)據(jù) 225
9.4 小結(jié) 229

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)