注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)原理:復(fù)雜信息的準(zhǔn)備、共享和分析

大數(shù)據(jù)原理:復(fù)雜信息的準(zhǔn)備、共享和分析

大數(shù)據(jù)原理:復(fù)雜信息的準(zhǔn)備、共享和分析

定 價(jià):¥79.00

作 者: [美] 朱爾斯·伯曼(Jules Berman) 著;邢春曉 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111572169 出版時(shí)間: 2017-08-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 202 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  當(dāng)大數(shù)據(jù)資源變得越發(fā)復(fù)雜時(shí),僅靠更強(qiáng)大的計(jì)算機(jī)系統(tǒng)已無(wú)法解決問(wèn)題。本書帶我們重新審視數(shù)據(jù)準(zhǔn)備環(huán)節(jié),重點(diǎn)討論了其中至關(guān)重要但又常常被忽略的主題——標(biāo)識(shí)符、不變性、內(nèi)省和數(shù)據(jù)索引。此外,書中也涵蓋常見的與大數(shù)據(jù)設(shè)計(jì)、架構(gòu)、操作和分析相關(guān)的內(nèi)容,以及涉及法律、社會(huì)和倫理問(wèn)題的非技術(shù)性章節(jié)。全書視角獨(dú)特,涉獵廣博,尤以醫(yī)學(xué)大數(shù)據(jù)分析見長(zhǎng),強(qiáng)調(diào)基本原理,不關(guān)注編程細(xì)節(jié)和數(shù)學(xué)公式,適合企業(yè)決策者、技術(shù)專家以及計(jì)算機(jī)相關(guān)專業(yè)的學(xué)生閱讀。

作者簡(jiǎn)介

  Jules J. Berman 本科畢業(yè)于麻省理工學(xué)院,在獲得了該校的兩個(gè)科學(xué)學(xué)士學(xué)位(數(shù)學(xué)、地球與行星科學(xué))后,他又獲得了天普大學(xué)的哲學(xué)博士學(xué)位以及邁阿密大學(xué)的醫(yī)學(xué)博士學(xué)位。他的博士研究工作是在天普大學(xué)的費(fèi)爾斯癌癥研究所和位于紐約瓦爾哈拉的美國(guó)健康基金會(huì)完成的。Berman博士在美國(guó)國(guó)家健康研究院完成了他的博士后研究工作,并曾在華盛頓特區(qū)的喬治·華盛頓大學(xué)醫(yī)學(xué)中心實(shí)習(xí)過(guò)一段時(shí)間。Berman博士曾在馬里蘭州巴爾的摩市退伍軍人管理局醫(yī)療中心擔(dān)任解剖病理學(xué)、外科病理學(xué)和細(xì)胞病理學(xué)的首席專家,在那里他被任命為馬里蘭大學(xué)醫(yī)學(xué)中心和約翰·霍普金斯醫(yī)學(xué)研究機(jī)構(gòu)的主任。1998年,他在美國(guó)國(guó)家癌癥研究所癌癥診斷計(jì)劃中任病理信息學(xué)項(xiàng)目主管,在那里他從事大數(shù)據(jù)項(xiàng)目工作。2006年,Berman博士成為病理信息學(xué)協(xié)會(huì)主席。2011年,他獲得了病理信息學(xué)協(xié)會(huì)終身成就獎(jiǎng)。他是數(shù)百部科學(xué)出版物的作者之一。如今,Berman博士是一名自由作家,專注于信息科學(xué)、計(jì)算機(jī)程序設(shè)計(jì)和病理學(xué)三個(gè)專業(yè)領(lǐng)域的書籍寫作。

圖書目錄

譯者序
前言
作者簡(jiǎn)介
第0章 引言1
0.1 大數(shù)據(jù)的定義2
0.2 大數(shù)據(jù)VS小數(shù)據(jù)2
0.3 大數(shù)據(jù)在哪里4
0.4 大數(shù)據(jù)最常見的目的是產(chǎn)生小數(shù)據(jù)5
0.5 機(jī)會(huì)6
0.6 大數(shù)據(jù)成為信息宇宙的中心6
第1章 為非結(jié)構(gòu)化數(shù)據(jù)提供結(jié)構(gòu)8
1.1 背景8
1.2 機(jī)器翻譯9
1.3 自動(dòng)編碼11
1.4 索引14
1.5 術(shù)語(yǔ)提取16
第2章 標(biāo)識(shí)、去標(biāo)識(shí)和重標(biāo)識(shí)19
2.1 背景19
2.2 標(biāo)識(shí)符系統(tǒng)的特征20
2.3 注冊(cè)唯一對(duì)象標(biāo)識(shí)符21
2.4 糟糕的標(biāo)識(shí)方法24
2.5 在標(biāo)識(shí)符中嵌入信息:不推薦25
2.6 單向哈希函數(shù)26
2.7 案例:醫(yī)院登記27
2.8 去標(biāo)識(shí)化28
2.9 數(shù)據(jù)清洗29
2.10 重標(biāo)識(shí)30
2.11 經(jīng)驗(yàn)教訓(xùn)31
第3章 本體論和語(yǔ)義學(xué)32
3.1 背景32
3.2 分類:最簡(jiǎn)單的本體32
3.3 本體:有多個(gè)父類的類34
3.4 分類模型選擇35
3.5 資源描述框架模式簡(jiǎn)介38
3.6 本體開發(fā)的常見陷阱40
第4章 內(nèi)省42
4.1 背景42
4.2 自我認(rèn)知42
4.3 可擴(kuò)展標(biāo)記語(yǔ)言44
4.4 meaning簡(jiǎn)介45
4.5 命名空間與有意義的聲明集合體46
4.6 資源描述框架三元組47
4.7 映射49
4.8 案例:可信時(shí)間戳50
4.9 總結(jié)50
第5章 數(shù)據(jù)集成和軟件互操作性52
5.1 背景52
5.2 調(diào)查標(biāo)準(zhǔn)委員會(huì)53
5.3 標(biāo)準(zhǔn)軌跡53
5.4 規(guī)范與標(biāo)準(zhǔn)56
5.5 版本控制58
5.6 合規(guī)問(wèn)題60
5.7 大數(shù)據(jù)資源接口60
第6章 不變性和永久性62
6.1 背景62
6.2 不變性和標(biāo)識(shí)符63
6.3 數(shù)據(jù)對(duì)象64
6.4 遺留數(shù)據(jù)65
6.5 數(shù)據(jù)產(chǎn)生數(shù)據(jù)67
6.6 跨機(jī)構(gòu)協(xié)調(diào)標(biāo)識(shí)符67
6.7 零知識(shí)協(xié)調(diào)68
6.8 管理者的負(fù)擔(dān)69
第7章 測(cè)量70
7.1 背景70
7.2 計(jì)數(shù)70
7.3 基因計(jì)數(shù)72
7.4 處理否定73
7.5 理解控制74
7.6 測(cè)量的實(shí)踐意義75
7.7 強(qiáng)迫癥:偉大數(shù)據(jù)管理員的標(biāo)志76
第8章 簡(jiǎn)單有效的大數(shù)據(jù)技術(shù)77
8.1 背景77
8.2 觀察數(shù)據(jù)78
8.3 數(shù)據(jù)范圍85
8.4 分母87
8.5 頻率分布89
8.6 均值和標(biāo)準(zhǔn)差92
8.7 估計(jì)分析94
8.8 案例:用谷歌Ngram發(fā)現(xiàn)數(shù)據(jù)趨勢(shì)95
8.9 案例:預(yù)測(cè)觀眾的電影偏好97
第9章 分析99
9.1 背景99
9.2 分析任務(wù)99
9.3 聚類、分類、推薦和建模100
9.3.1 聚類算法100
9.3.2 分類算法101
9.3.3 推薦算法101
9.3.4 建模算法101
9.4 數(shù)據(jù)約簡(jiǎn)103
9.5 數(shù)據(jù)標(biāo)準(zhǔn)化和調(diào)整105
9.6 大數(shù)據(jù)軟件:速度和可擴(kuò)展性107
9.7 尋找關(guān)系而非相似之處108
第10章 大數(shù)據(jù)分析中的特殊注意事項(xiàng)111
10.1 背景111
10.2 數(shù)據(jù)搜索理論111
10.3 理論搜索中的數(shù)據(jù)112
10.4 過(guò)度擬合113
10.5 巨大的偏差113
10.6 數(shù)據(jù)太多116
10.7 數(shù)據(jù)修復(fù)116
10.8 大數(shù)據(jù)的數(shù)據(jù)子集:不可加和不傳遞117
10.9 其他大數(shù)據(jù)缺陷117
第11章 逐步走進(jìn)大數(shù)據(jù)分析120
11.1 背景120
11.2 步驟1:制定一個(gè)問(wèn)題120
11.3 步驟2:資源評(píng)價(jià)121
11.4 步驟3:重新制定一個(gè)問(wèn)題121
11.5 步驟4:查詢輸出充分性122
11.6 步驟5:數(shù)據(jù)描述122
11.7 步驟6:數(shù)據(jù)約簡(jiǎn)123
11.8 步驟7:必要時(shí)選擇算法123
11.9 步驟8:結(jié)果評(píng)估和結(jié)論斷言124
11.10 步驟9:結(jié)論審查和驗(yàn)證125
第12章 失敗127
12.1 背景127
12.2 失敗很常見128
12.3 失敗的標(biāo)準(zhǔn)128
12.4 復(fù)雜性131
12.5 復(fù)雜性何時(shí)起作用132
12.6 冗余失敗的情況132
12.7 保護(hù)錢,不保護(hù)無(wú)害信息133
12.8 失敗之后134
12.9 案例:癌癥生物醫(yī)學(xué)信息學(xué)網(wǎng)格—遙遠(yuǎn)的橋135
第13章 合法性140
13.1 背景140
13.2 對(duì)數(shù)據(jù)的準(zhǔn)確性和合法性負(fù)責(zé)140
13.3 創(chuàng)建、使用和共享資源的權(quán)利141
13.4 因使用標(biāo)準(zhǔn)而招致的版權(quán)和專利侵權(quán)行為143
13.5 對(duì)個(gè)人的保護(hù)144
13.6 許可問(wèn)題145
13.7 未經(jīng)許可的數(shù)據(jù)148
13.8 好政策是有力保障150
13.9 案例:哈瓦蘇派的故事151
第14章 社會(huì)問(wèn)題153
14.1 背景153
14.2 大數(shù)據(jù)感知153
14.3 數(shù)據(jù)共享155
14.4 用大數(shù)據(jù)降低成本和提高生產(chǎn)效率158
14.5 公眾的疑慮160
14.6 從自己做起161
14.7 傲慢和夸張162
第15章 未來(lái)164
15.1 背景164
15.1.1 大數(shù)據(jù)計(jì)算復(fù)雜,需要新一代超級(jí)計(jì)算機(jī)?165
15.1.2 大數(shù)據(jù)的復(fù)雜程度將超出我們完全理解或信任的能力范圍?166
15.1.3 我們需要用超級(jí)計(jì)算中的最新技術(shù)訓(xùn)練出一支計(jì)算機(jī)科學(xué)家組成的團(tuán)隊(duì)嗎?166
15.1.4 大數(shù)據(jù)會(huì)創(chuàng)建出那些目前沒有訓(xùn)練程序的新型數(shù)據(jù)專業(yè)人員嗎?166
15.1.5 是否有將數(shù)據(jù)表示方法通過(guò)統(tǒng)一的標(biāo)準(zhǔn)規(guī)范化,從而支持跨網(wǎng)絡(luò)大數(shù)據(jù)資源的數(shù)據(jù)集成和軟件互操作性的可能?169
15.1.6 大數(shù)據(jù)將向公眾開放?169
15.1.7 大數(shù)據(jù)弊大于利?170
15.1.8 我們可以預(yù)測(cè)大數(shù)據(jù)災(zāi)難會(huì)破壞至關(guān)重要的服務(wù)、削弱國(guó)家經(jīng)濟(jì)、破壞世界政治的穩(wěn)定嗎?171
15.1.9 大數(shù)據(jù)可以回答那些其他辦法不能解決的問(wèn)題嗎?171
15.2 后記171
術(shù)語(yǔ)表172
參考文獻(xiàn)188
索引196

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)