大數(shù)據(jù)所依仗的就是數(shù)據(jù)量大。要想獲得大數(shù)據(jù)帶來的好處,混亂應(yīng)該是一種標(biāo)準(zhǔn)途徑,而不應(yīng)該是竭力避免的。接受數(shù)據(jù)的不完美和不精準(zhǔn),承認(rèn)它們的雜亂,我們才能夠更好地進(jìn)行預(yù)測,更好地認(rèn)識和理解世界萬物。一旦我們能正確地看待各類數(shù)據(jù)存在的價值,我們就會發(fā)現(xiàn)完全不必為數(shù)據(jù)的雜亂煩惱,擁抱數(shù)據(jù)的雜亂讓我們進(jìn)一步接近事實(shí)的真相,更加全面地認(rèn)識這個世界。這就是大數(shù)據(jù)最美的地方。
基于數(shù)據(jù)發(fā)現(xiàn)的五種知識類型
(1)廣義型知識:根據(jù)數(shù)據(jù)的微觀特性發(fā)現(xiàn)其表征的、帶有普遍性的、高層次概念的、中觀或宏觀的知識。
(2)分類型知識:反映同類事物共同性質(zhì)的特征型知識和不同事物之間差異型特征知識。用于反映數(shù)據(jù)的匯聚模式或根據(jù)對象的屬性區(qū)分其所屬類別。
(3)關(guān)聯(lián)型知識:反映一個事件和其他事件之間依賴或關(guān)聯(lián)的知識,又稱依賴關(guān)系,這類知識可用于數(shù)據(jù)庫中的歸一化、查詢優(yōu)化等。
(4)預(yù)測型知識:通過時間序列型數(shù)據(jù),由歷史的和當(dāng)前的數(shù)據(jù)預(yù)測未來的情況,它實(shí)際上是一種以時間為關(guān)鍵屬性的關(guān)聯(lián)知識。
(5)偏差型知識:通過分析標(biāo)準(zhǔn)類以外的特例、數(shù)據(jù)聚類外的離群值、實(shí)際觀測值和系統(tǒng)預(yù)測值間的顯著差別,對差異和極端特例進(jìn)行描述。