注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡家庭與辦公軟件數(shù)據(jù)架構(gòu):數(shù)據(jù)科學家的第一本書(原書第2版)

數(shù)據(jù)架構(gòu):數(shù)據(jù)科學家的第一本書(原書第2版)

數(shù)據(jù)架構(gòu):數(shù)據(jù)科學家的第一本書(原書第2版)

定 價:¥89.00

作 者: [美] W.H.因蒙 著,黃智瀕 陶袁譯 譯
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111679608 出版時間: 2021-05-01 包裝: 平裝
開本: 16開 頁數(shù): 244 字數(shù):  

內(nèi)容簡介

  本書由“數(shù)據(jù)倉庫之父”Inmon和“Data Vault之父”Linstedt領(lǐng)銜撰寫,帶領(lǐng)讀者從宏觀視角了解數(shù)據(jù)架構(gòu)的基本概念和原則,是數(shù)據(jù)科學家、分析師和管理者在入門階段的必備參考讀物。本書創(chuàng)新性地提出終端狀態(tài)架構(gòu)的概念,新增了關(guān)于可視化和大數(shù)據(jù)的章節(jié),以及文本管理和分析等來自不同行業(yè)的實例。通過閱讀本書,讀者將通曉數(shù)據(jù)收集、治理、提取、分析等不同階段的核心技術(shù),進而學會將大數(shù)據(jù)技術(shù)融入現(xiàn)有的信息基礎(chǔ)設(shè)施或數(shù)據(jù)倉庫系統(tǒng)。

作者簡介

暫缺《數(shù)據(jù)架構(gòu):數(shù)據(jù)科學家的第一本書(原書第2版)》作者簡介

圖書目錄

獻詞
譯者序
第1章 數(shù)據(jù)架構(gòu)與數(shù)據(jù)類型1
1.1 數(shù)據(jù)架構(gòu)簡介1
1.1.1 細分數(shù)據(jù)1
1.1.2 重復性和非重復性非結(jié)構(gòu)化數(shù)據(jù)2
1.1.3 數(shù)據(jù)的“分水嶺”2
1.1.4 文本數(shù)據(jù)和非文本數(shù)據(jù)3
1.1.5 各種形式的數(shù)據(jù)3
1.1.6 商業(yè)價值4
1.2 數(shù)據(jù)基礎(chǔ)設(shè)施4
1.2.1 重復性數(shù)據(jù)的兩種類型4
1.2.2 重復性結(jié)構(gòu)化數(shù)據(jù)5
1.2.3 重復性大數(shù)據(jù)6
1.2.4 兩種基礎(chǔ)設(shè)施6
1.2.5 基礎(chǔ)設(shè)施的優(yōu)化7
1.2.6 比較兩種基礎(chǔ)設(shè)施8
1.3 分水嶺8
1.3.1 企業(yè)數(shù)據(jù)的分類8
1.3.2 什么是分水嶺9
1.3.3 重復性非結(jié)構(gòu)化數(shù)據(jù)9
1.3.4 非重復性非結(jié)構(gòu)化數(shù)據(jù)10
1.3.5 不同的環(huán)境12
1.4 企業(yè)數(shù)據(jù)統(tǒng)計圖13
1.5 企業(yè)數(shù)據(jù)分析16
1.6 數(shù)據(jù)的生命周期:理解時間線上的數(shù)據(jù)19
1.7 數(shù)據(jù)簡史23
1.7.1 紙帶和打孔卡23
1.7.2 磁帶23
1.7.3 磁盤存儲器24
1.7.4 數(shù)據(jù)庫管理系統(tǒng)24
1.7.5 耦合處理器24
1.7.6 在線事務處理24
1.7.7 數(shù)據(jù)倉庫25
1.7.8 并行數(shù)據(jù)管理25
1.7.9 數(shù)據(jù)保險箱25
1.7.10 大數(shù)據(jù)25
1.7.11 分水嶺26
第2章 終端狀態(tài)架構(gòu)——“世界地圖”27
2.1 架構(gòu)組件27
2.2 終端狀態(tài)架構(gòu)中不同類型的數(shù)據(jù)28
2.3 通過模型塑造數(shù)據(jù)29
2.4 數(shù)據(jù)倉庫在哪里30
2.5 不同類型的問題在終端狀態(tài)架構(gòu)中得到不同的回答31
2.6 數(shù)據(jù)湖中的數(shù)據(jù)31
2.7 終端狀態(tài)架構(gòu)中的元數(shù)據(jù)32
2.8 網(wǎng)絡化元數(shù)據(jù)32
2.9 演變的經(jīng)驗33
2.10 數(shù)據(jù)湖架構(gòu)34
第3章 終端狀態(tài)架構(gòu)中的轉(zhuǎn)換35
3.1 冗余數(shù)據(jù)35
3.2 轉(zhuǎn)換35
3.3 定制數(shù)據(jù)36
3.4 轉(zhuǎn)換文本37
3.5 轉(zhuǎn)換應用數(shù)據(jù)37
3.6 將數(shù)據(jù)轉(zhuǎn)換為定制狀態(tài)38
3.7 將數(shù)據(jù)轉(zhuǎn)換為批量存儲38
3.8 自動生成數(shù)據(jù)的轉(zhuǎn)換39
3.9 轉(zhuǎn)換批量數(shù)據(jù)39
3.10 轉(zhuǎn)換和冗余40
第4章 大數(shù)據(jù)41
4.1 大數(shù)據(jù)簡史41
4.1.1 類比—占領(lǐng)制高點41
4.1.2 占領(lǐng)制高點42
4.1.3 IBM 360的標準化42
4.1.4 在線事務處理42
4.1.5 Teradata和MPP處理43
4.1.6 Hadoop和大數(shù)據(jù)43
4.1.7 IBM和Hadoop43
4.1.8 堅守制高點43
4.2 何謂大數(shù)據(jù)43
4.2.1 另一種定義44
4.2.2 大體量44
4.2.3 廉價存儲44
4.2.4 羅馬人口普查方法44
4.2.5 非結(jié)構(gòu)化數(shù)據(jù)45
4.2.6 大數(shù)據(jù)中的數(shù)據(jù)46
4.2.7 重復性數(shù)據(jù)的語境46
4.2.8 非重復性數(shù)據(jù)47
4.2.9 非重復性數(shù)據(jù)的語境47
4.3 并行處理49
4.4 非結(jié)構(gòu)化數(shù)據(jù)53
4.4.1 無處不在的文本信息53
4.4.2 基于結(jié)構(gòu)化數(shù)據(jù)的決策53
4.4.3 商業(yè)價值建議54
4.4.4 重復性和非重復性非結(jié)構(gòu)化信息54
4.4.5 易于分析55
4.4.6 語境化56
4.4.7 一些語境化方法56
4.4.8 Map Reduce57
4.4.9 手工分析58
4.5 將重復性非結(jié)構(gòu)化數(shù)據(jù)語境化58
4.5.1 解析重復性非結(jié)構(gòu)化數(shù)據(jù)59
4.5.2 重鑄輸出數(shù)據(jù)59
4.6 文本消歧59
4.6.1 從敘述性數(shù)據(jù)庫到分析性數(shù)據(jù)庫60
4.6.2 文本消歧的輸入60
4.6.3 映射61
4.6.4 輸入/輸出61
4.6.5 文檔分解和命名值處理62
4.6.6 文檔預處理63
4.6.7 電子郵件63
4.6.8 電子表格64
4.6.9 報告反編譯器64
4.7 分類法65
4.7.1 數(shù)據(jù)模型和分類法66
4.7.2 分類法的適用性67
4.7.3 什么是分類法67
4.7.4 多種語言的分類法68
4.7.5 商業(yè)分類法還是私人分類法68
4.7.6 分類法和文本消歧的動態(tài)過程68
4.7.7 分類法和文本消歧的分離技術(shù)68
4.7.8 分類法的不同類型69
4.7.9 分類法—隨著時間的推移進行維護70
第5章 孤島式應用環(huán)境71
5.1 孤島式應用的挑戰(zhàn)71
5.2 構(gòu)建孤島式應用73
5.3 孤島式應用是什么樣的74
5.4 當前值數(shù)據(jù)74
5.5 限度的歷史數(shù)據(jù)75
5.6 高可用性76
5.7 孤島式應用之間的重疊76
5.8 凍結(jié)業(yè)務需求77
5.9 拆除孤島式應用77
第6章 數(shù)據(jù)保險箱78
6.1 數(shù)據(jù)保險箱2.0簡介78
6.1.1 數(shù)據(jù)保險箱的起源和背景78
6.1.2 什么是數(shù)據(jù)保險箱2.0建模80
6.1.3 如何定義數(shù)據(jù)保險箱2.0方法論81
6.1.4 為什么需要數(shù)據(jù)保險箱2.0架構(gòu)81
6.1.5 數(shù)據(jù)保險箱2.0的實施范圍81
6.1.6 數(shù)據(jù)保險箱2.0的商業(yè)利益81
6.1.7 數(shù)據(jù)保險箱1.0簡介82
6.2 數(shù)據(jù)保險箱建模簡介83
6.2.1 數(shù)據(jù)保險箱模型的概念83
6.2.2 數(shù)據(jù)保險箱模型的定義83
6.2.3 數(shù)據(jù)保險箱模型的組成部分83
6.2.4 業(yè)務鍵為何如此重要84
6.2.5 數(shù)據(jù)保險箱和數(shù)據(jù)倉庫的關(guān)系85
6.2.6 如何轉(zhuǎn)換到數(shù)據(jù)保險箱建模85
6.2.7 為什么要對暫存區(qū)的數(shù)據(jù)進行限制86
6.2.8 數(shù)據(jù)保險箱模型的基本規(guī)則86
6.2.9 為什么需要很多鏈接結(jié)構(gòu)87
6.2.10 數(shù)據(jù)保險箱2.0的主鍵選項87
6.3 數(shù)據(jù)保險箱架構(gòu)簡介93

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號