注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)預處理技術(shù)

大數(shù)據(jù)預處理技術(shù)

大數(shù)據(jù)預處理技術(shù)

定 價:¥68.00

作 者: 謝向東,許桂秋 編
出版社: 浙江科學技術(shù)出版社
叢編項: 大數(shù)據(jù)專業(yè)應用型人才培養(yǎng)規(guī)劃教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787534188930 出版時間: 2020-01-01 包裝: 平裝
開本: 16開 頁數(shù): 280 字數(shù):  

內(nèi)容簡介

  數(shù)據(jù)預處理是進行數(shù)據(jù)挖掘前必不可少的準備工作,更是數(shù)據(jù)挖掘中的關(guān)鍵一步。數(shù)據(jù)預處理一方面可以保證數(shù)據(jù)挖掘的正確性和有效性;另一方面通過對數(shù)據(jù)格式和內(nèi)容的調(diào)整,可使數(shù)據(jù)更符合挖掘的需要?!洞髷?shù)據(jù)預處理技術(shù)/大數(shù)據(jù)專業(yè)應用型人才培養(yǎng)規(guī)劃教材》采用理論與實踐相結(jié)合的方式,詳細講解了如何通過Ketle和Python實現(xiàn)數(shù)據(jù)預處理。《大數(shù)據(jù)預處理技術(shù)/大數(shù)據(jù)專業(yè)應用型人才培養(yǎng)規(guī)劃教材》可作為高等院校數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)、計算機、信息管理等相關(guān)專業(yè)課程的教材,參考課時為64課時。

作者簡介

暫缺《大數(shù)據(jù)預處理技術(shù)》作者簡介

圖書目錄

第1章 數(shù)據(jù)預處理概述
1.1 數(shù)據(jù)預處理的背景與目的
1.2 數(shù)據(jù)預處理的流程
1.3 數(shù)據(jù)預處理的工具
第2章 Kettle的初步使用
2.1 Kettle的安裝
2.2 Kettle的使用
第3章 基于Kettle的數(shù)據(jù)導人與導出
3.1 基于文件的數(shù)據(jù)導入與導出
3.2 基于數(shù)據(jù)庫的數(shù)據(jù)導入與導出
3.3 基于CDC變*數(shù)據(jù)的導人與導出
第4章 數(shù)據(jù)清理
4.1 數(shù)據(jù)清理概述
4.2 數(shù)據(jù)排重
4.3 使用腳本組件進行數(shù)據(jù)清理
第5章 Kettle作業(yè)設計
5.1 作業(yè)的概念及組成
5.2 作業(yè)的執(zhí)行方式
5.3 作業(yè)的創(chuàng)建及常用作業(yè)項
5.4 變量
5.5 監(jiān)控
5.6 命令行啟動
5.7 作業(yè)實驗
第6章 構(gòu)建數(shù)據(jù)倉庫
6.1 構(gòu)建維度表
6.2 構(gòu)建事實表
第7章 基于Python的數(shù)據(jù)導入與導出
7.1 Pandas
7.2 文本文件的導入與導出
7.3 二進制文件的導人與導出
7.4 數(shù)據(jù)庫的導入與導出
第8章 基于Python的數(shù)據(jù)整理
8.1 合并多個數(shù)據(jù)集
8.2 數(shù)據(jù)重塑
8.3 數(shù)據(jù)轉(zhuǎn)換
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號