注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)工業(yè)技術(shù)自動(dòng)化技術(shù)、計(jì)算技術(shù)基于R語(yǔ)言的數(shù)據(jù)清洗技術(shù)

基于R語(yǔ)言的數(shù)據(jù)清洗技術(shù)

基于R語(yǔ)言的數(shù)據(jù)清洗技術(shù)

定 價(jià):¥59.00

作 者: 白世貞,魏勝,薛寧 著
出版社: 經(jīng)濟(jì)管理出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書(shū)可以去


ISBN: 9787509683149 出版時(shí)間: 2022-03-01 包裝:
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  數(shù)據(jù)分析指的是將數(shù)據(jù)轉(zhuǎn)化為價(jià)值的一個(gè)完整過(guò)程,而分析數(shù)據(jù)只是其中的一個(gè)環(huán)節(jié)而已,第一步工作應(yīng)該是梳理業(yè)務(wù)目標(biāo)。人們?cè)谶M(jìn)行數(shù)據(jù)分析的時(shí)候,業(yè)務(wù)目標(biāo)與分析數(shù)據(jù)之間還有一個(gè)環(huán)節(jié)的工作——數(shù)據(jù)清洗。當(dāng)你辛辛苦苦梳理完業(yè)務(wù)目標(biāo),結(jié)果還沒(méi)有對(duì)數(shù)據(jù)進(jìn)行必要的清洗工作就去分析,那么分析的結(jié)果很有可能是完全錯(cuò)誤的。而《基于R語(yǔ)言的數(shù)據(jù)清洗技術(shù)》的目標(biāo)就是帶領(lǐng)讀者去識(shí)別數(shù)據(jù)中可能存在的問(wèn)題,并借助R語(yǔ)言這個(gè)工具將問(wèn)題數(shù)據(jù)清洗干凈,這樣才會(huì)使得后續(xù)的分析結(jié)果更加真實(shí)可信。

作者簡(jiǎn)介

  白世貞,1962年生,山東菏澤人,系統(tǒng)工程博士,常年從事工商管理、物流與供應(yīng)鏈管理的研究與教學(xué)。主持國(guó)家自然科學(xué)基金、國(guó)家科技支撐計(jì)劃重點(diǎn)專項(xiàng)子課題等***項(xiàng)目5項(xiàng);在SSGI期刊收錄、《中國(guó)管理科學(xué)》等國(guó)內(nèi)A刊發(fā)表論文30余篇;出版《供應(yīng)鏈復(fù)雜系統(tǒng)建模與仿真》等專著5部;主編出版***規(guī)劃教材4部。魏勝,吉林大學(xué)企業(yè)管理專業(yè)博士,哈爾濱商業(yè)大學(xué)管理學(xué)院副教授,在《數(shù)理統(tǒng)計(jì)與管理》《經(jīng)濟(jì)管理》等期刊發(fā)表論文7篇。薛寧,河南南陽(yáng)人,哈爾濱商業(yè)大學(xué)管理學(xué)院2018級(jí)博士生。研究方向:物流與供應(yīng)鏈管理。參與多項(xiàng)國(guó)家社科基金項(xiàng)目。

圖書(shū)目錄

1 認(rèn)識(shí)本書(shū)的數(shù)據(jù)集
1.1 引言
1.2 涉及數(shù)據(jù)清洗的基本函數(shù)
1.2.1 進(jìn)行缺失值判斷-is.na函數(shù)
1.2.2 進(jìn)行頻次統(tǒng)計(jì)-table函數(shù)
1.2.3 進(jìn)行數(shù)據(jù)定位-which函數(shù)
1.2.4 進(jìn)行數(shù)據(jù)概覽-summar函數(shù)
1.2.5 輸出選定部分-head函數(shù)
1.3 讀入數(shù)據(jù)
1.4 數(shù)據(jù)的結(jié)構(gòu)與基本信息
1.4.1 該數(shù)據(jù)集的結(jié)構(gòu)
1.4.2 該數(shù)據(jù)集的基本信息
1.5 業(yè)務(wù)目標(biāo)與數(shù)據(jù)清洗工作
2 識(shí)別與清洗數(shù)值型數(shù)據(jù)中的異常值
2.1 引言
2.2 梳理業(yè)務(wù)目標(biāo)
2.3 快速清洗異常數(shù)據(jù)
2.3.1 快速識(shí)別與刪除缺失值
2.3.2 快速識(shí)別離群值
2.4 清洗離群值
2.4.1 利用經(jīng)驗(yàn)清洗離群值
2.4.2 利用均值與標(biāo)準(zhǔn)差檢測(cè)離群值
2.4.3 截去部分離群值
2.4.4 利用四分位差檢測(cè)離群值
2.5 其他數(shù)值數(shù)據(jù)清洗技術(shù)
2.5.1 最大值與最小值
2.5.2 排序
2.5.3 數(shù)值變量的分位數(shù)
2.5.4 自定義函數(shù):數(shù)據(jù)截?cái)?br />2.6 小結(jié)
……
3 利用正則表達(dá)式檢測(cè)字符型數(shù)據(jù)
4 處理時(shí)間與日期類型的數(shù)據(jù)
5 重復(fù)數(shù)據(jù)及其異常值
6 多數(shù)據(jù)集處理
7 用戶分析與數(shù)據(jù)清洗工作
8 清洗字符型數(shù)據(jù)
參考文獻(xiàn)
后記

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)