注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)家庭與辦公軟件社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)

社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)

社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)

定 價:¥119.00

作 者: [美] Matthew A.Russell,Mikhail Klassen 著,蘇統(tǒng)華,郭勇,潘巍 譯
出版社: 機械工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787111674047 出版時間: 2021-02-01 包裝: 平裝
開本: 16開 頁數(shù): 334 字數(shù):  

內(nèi)容簡介

  《社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)》指導(dǎo)你挖掘隱藏在Twitter、Facebook、Linkedln、Instagram和GitHub等流行社交網(wǎng)站上的豐富數(shù)據(jù)。通過這本暢銷指南,數(shù)據(jù)科學(xué)家、分析師和程序員將學(xué)習(xí)如何在Jupyter Notebook或者Docker容器中使用Python代碼分析社交媒體中的真知灼見——哪些人正在通過社交媒體進行聯(lián)系?他們正在談?wù)撌裁??他們目前身在何處?在《社交網(wǎng)站的數(shù)據(jù)挖掘與分析(原書第3版)》的第一部分,每一章都聚焦社交網(wǎng)站生態(tài)的某個具體方面,囊括了各大主流社交網(wǎng)站,也包括了網(wǎng)頁、博客和訂閱源、郵箱、GitHub以及新增加的Instagram的內(nèi)容。第二部分提供了實用指南,其中包括超過20個供挖掘Twitter數(shù)據(jù)之用的簡短代碼解決方案。

作者簡介

  Matthew A.Russell是Built科技公司的首席技術(shù)官。他帶領(lǐng)團隊為實現(xiàn)“改進世界運轉(zhuǎn)方式”這一愿景而工作。在工作之余,他追尋zhong極真理,崇尚自由,并嘗試研發(fā)超能機器人。Mikhail Klassen是Paladin Al公司的聯(lián)合創(chuàng)始人和首席數(shù)據(jù)科學(xué)家,該公司坐落于蒙特利爾,是面向航空領(lǐng)域提供數(shù)據(jù)分析服務(wù)的初創(chuàng)公司。他的工作是借助數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)為飛行員設(shè)計下一代基于數(shù)據(jù)驅(qū)動的自適應(yīng)培訓(xùn)方案。

圖書目錄

前言
第一部分 社交網(wǎng)站導(dǎo)引
序幕
第1章 挖掘Twitter:探索熱門話題、發(fā)現(xiàn)人們的談?wù)搩?nèi)容等
1.1 概述
1.2 Twitter風(fēng)靡一時的原因
1.3 探索Twitter API
1.3.1 基本的Twitter術(shù)語
1.3.2 創(chuàng)建一個Twitter API連接
1.3.3 探索熱門話題
1.3.4 搜索推文
1.4 分析140字(或更多)的推文
1.4.1 提取推文實體
1.4.2 使用頻率分析技術(shù)分析推文和推文實體
1.4.3 計算推文的詞匯豐富性
1.4.4 檢視轉(zhuǎn)推模式
1.4.5 使用直方圖將頻率數(shù)據(jù)可視化
1.5 本章小結(jié)
1.6 推薦練習(xí)
1.7 在線資源
第2章 挖掘Facebook:分析粉絲頁面、查看好友關(guān)系等
2.1 概述
2.2 探索Facebook的圖譜API
2.2.1 理解圖譜API
2.2.2 理解開放圖協(xié)議
2.3 分析社交圖譜聯(lián)系
2.3.1 分析Facebook頁面
2.3.2 使用pandas操作數(shù)據(jù)
2.4 本章小結(jié)
2.5 推薦練習(xí)
2.6 在線資源
第3章 挖掘Instagram:計算機視覺、神經(jīng)網(wǎng)絡(luò)、對象識別和人臉檢測
3.1 概述
3.2 探索Instagram API
3.2.1 建立Instagram API請求
3.2.2 獲取你自己的Instagram訂閱源
3.2.3 通過主題標(biāo)簽檢索媒體
3.3 Instagram帖子的剖析
3.4 人工神經(jīng)網(wǎng)絡(luò)速成
3.4.1 訓(xùn)練神經(jīng)網(wǎng)絡(luò)“看”圖片
3.4.2 手寫數(shù)字識別
3.4.3 使用預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)在照片中識別物體
3.5 神經(jīng)網(wǎng)絡(luò)在Instagram帖子中的應(yīng)用
3.5.1 標(biāo)記圖像內(nèi)容
3.5.2 在圖像中檢測人臉
3.6 本章小結(jié)
3.7 推薦練習(xí)
3.8 在線資源
第4章 挖掘LinkedIn:分組職位、聚類同行等
4.1 概述
4.2 探索LinkedIn API
4.2.1 發(fā)起LinkedIn API請求
4.2.2 下載LinkedIn的聯(lián)系人并保存為CSV文件
4.3 數(shù)據(jù)聚類速成
4.3.1 對數(shù)據(jù)進行規(guī)范化處理以便進行分析
4.3.2 測量相似度
4.3.3 聚類算法
4.4 本章小結(jié)
4.5 推薦練習(xí)
4.6 在線資源
第5章 挖掘文本文件:計算文檔相似度、提取搭配等
5.1 概述
5.2 文本文件
5.3 TF-IDF簡介
5.3.1 詞頻
5.3.2 逆文檔頻率
5.3.3 TF-IDF
5.4 用TF-IDF查詢?nèi)祟愓Z言數(shù)據(jù)
5.4.1 自然語言工具包概述
5.4.2 對人類語言使用TF-IDF
5.4.3 查找相似文檔
5.4.4 分析人類語言中的二元文法
5.4.5 分析人類語言數(shù)據(jù)的反思
5.5 本章小結(jié)
5.6 推薦練習(xí)
5.7 在線資源
第6章 挖掘網(wǎng)頁:使用自然語言處理理解人類語言、總結(jié)博客內(nèi)容等
6.1 概述
6.2 抓取、解析和爬取網(wǎng)頁
6.3 通過解碼語法來探索語義
6.3.1 一步步講解自然語言處理
6.3.2 人類語言數(shù)據(jù)中的句子檢測
6.3.3 文檔摘要
6.4 以實體為中心的分析:范式轉(zhuǎn)換
6.5 人類語言數(shù)據(jù)處理分析的質(zhì)量
6.6 本章小結(jié)
6.7 推薦練習(xí)
6.8 在線資源
第7章 挖掘郵箱:分析誰和誰說什么以及說的頻率等
7.1 概述
7.2 獲取和處理郵件語料庫
7.2.1 Unix郵箱指南
7.2.2 獲得Enron數(shù)據(jù)
7.2.3 將郵件語料轉(zhuǎn)換為Unix郵箱
7.2.4 將Unix郵箱轉(zhuǎn)換為pandas DataFrame
7.3 分析Enron語料庫
7.3.1 根據(jù)日期-時間范圍查詢
7.3.2 發(fā)件人-收件人通信的分析模式
7.3.3 根據(jù)關(guān)鍵詞查找郵件
7.4 分析你自己的郵件數(shù)據(jù)
7.4.1 通過OAuth訪問你的Gmail
7.4.2 獲取和解析郵件
7.4.3 Immersion對電子郵件的可視化模式
7.5 本章小結(jié)
7.6 推薦練習(xí)
7.7 在線資源
第8章 挖掘GitHub:檢查軟件協(xié)同習(xí)慣、構(gòu)建興趣圖譜等
8.1 概述
8.2 探索GitHub的API
8.2.1 建立GitHub API連接
8.2.2 建立GitHub API請求
8.3 使用屬性圖為數(shù)據(jù)建模
8.4 分析GitHub興趣圖譜
8.4.1 初始化一個興趣圖譜
8.4.2 計算圖的中心度度量
8.4.3 為用戶添加“關(guān)注”邊來擴展興趣圖譜
8.4.4 以節(jié)點為中心獲得更高效的查詢
8.4.5 興趣圖譜的可視化
8.5 本章小結(jié)
8.6 推薦練習(xí)
8.7 在線資源
第二部分 Twitter數(shù)據(jù)挖掘與分析實用指南
第9章 Twitter數(shù)據(jù)挖掘與分析
9.1 訪問Twitter的API(開發(fā)目的)
9.2 使用OAuth訪問Twitter的API(產(chǎn)品目的)
9.3 探索流行話題
9.4 查找推文
9.5 構(gòu)造方便的函數(shù)調(diào)用
9.6 使用文本文件存儲JSON數(shù)據(jù)
9.7 使用MongoDB存儲和訪問JSON數(shù)據(jù)
9.8 使用信息流API對Twitter數(shù)據(jù)管道抽樣
9.9 采集時序數(shù)據(jù)
9.10 提取推文實體
9.11 在特定的推文范圍內(nèi)查找最流行的推文
9.12 在特定的推文范圍內(nèi)查找最流行的推文實體
9.13 對頻率分析制表
9.14 查找轉(zhuǎn)推了狀態(tài)的用戶
9.15 提取轉(zhuǎn)推的屬性
9.16 創(chuàng)建健壯的Twitter請求
9.17 獲取用戶檔案信息
9.18 從任意的文本中提取推文實體
9.19 獲得用戶的所有好友和關(guān)注者
9.20 分析用戶的好友和關(guān)注者
9.21 獲取用戶的推文
9.22 爬取好友關(guān)系圖
9.23 分析推文內(nèi)容
9.24 提取鏈接目標(biāo)摘要
9.25 分析用戶收藏的推文
9.26 本章小結(jié)
9.27 推薦練習(xí)
9.28 在線資源
第三部分 附錄
附錄A 關(guān)于本書虛擬機體驗的信息
附錄B OAuth入門
附錄C Python和Jupyter Notebook的使用技巧

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號