SQL是數(shù)據(jù)查詢的基本語言,Excel是數(shù)據(jù)分析和展示的*常見工具。兩者結(jié)合,可以組成一個強大且易于理解的業(yè)務(wù)數(shù)據(jù)分析工具。很多類重要的數(shù)據(jù)分析并不需要復(fù)雜且昂貴的數(shù)據(jù)挖掘工具。答案就在你的電腦桌上。這是一本實用指南,作者Gordon S. Linoff是數(shù)據(jù)挖掘領(lǐng)域的*專家。書中介紹了如何使用SQL和Excel來設(shè)計并完成復(fù)雜的數(shù)據(jù)分析。本書的第1版被廣泛認可,第2版涵蓋了對SQL和Excel新功能的介紹,同時包括新的技術(shù)和實際業(yè)務(wù)示例。第2版介紹了業(yè)務(wù)經(jīng)理和數(shù)據(jù)分析人員所需掌握的*新信息。本書首先介紹數(shù)據(jù)挖掘所用的SQL基礎(chǔ)知識,如何使用Excel展示結(jié)果,以及用于理解數(shù)據(jù)的簡單的統(tǒng)計學(xué)概念。熟悉執(zhí)行SQL和操作Excel后,本書介紹了核心分析技術(shù)。本書內(nèi)容逐步從基礎(chǔ)查詢擴展到復(fù)雜的應(yīng)用,使讀者能夠?qū)W習(xí)到某種數(shù)據(jù)分析的使用原因和時機,如何設(shè)計和實現(xiàn),以及展示數(shù)據(jù)分析結(jié)果的強大方法。每一步都詳細解釋了業(yè)務(wù)環(huán)境、技術(shù)方法以及在所熟悉工具中的具體實現(xiàn)。隨著對本書的閱讀,你會發(fā)現(xiàn)很多知識點,包括地理信息的重要性,圖表中的數(shù)據(jù)隨時間的變化方式,如何使用生存分析理解客戶任期和變動,以及影響生存率的因素。同時,還會探索到一些方法,包括分析客戶的購買模式、分析購物車以及計算關(guān)聯(lián)規(guī)則。此外,本書還包含重要的SQL數(shù)據(jù)挖掘模型(線性回歸模型、樸素貝葉斯模型等)、建立客戶簽名所需的信息、用于分析結(jié)果集的模型、包含累積增量圖表和ROC圖表、使用SQL的*佳實踐、提高查詢性能的方法等。
作者簡介
Gordon S. Linoff,從事數(shù)據(jù)庫工作數(shù)十年。在他的記憶中,他開始學(xué)習(xí)SQL時,還是SQL92標(biāo)準(zhǔn)版。當(dāng)時他正領(lǐng)導(dǎo)一支開發(fā)團隊(現(xiàn)已不存在的Thinking Machines公司),編寫*個側(cè)重于復(fù)雜查詢的高性能數(shù)據(jù)庫,用于支持決策分析。此后,Gordon在1998年合作創(chuàng)建了Data Miners公司,這是一家致力于數(shù)據(jù)挖掘、分析和大數(shù)據(jù)的咨詢公司。在他的工作生涯中,數(shù)據(jù)仍然是永恒的主題——而且通常是存儲于關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)。他對SQL的理解和應(yīng)用也變得越來越深刻和嫻熟。在2014年,他是Stack Overflow的*多貢獻者,Stack Overflow是行業(yè)內(nèi)領(lǐng)先的技術(shù)問答網(wǎng)站。Gordon編寫的另外幾本書也都是暢銷書:《數(shù)據(jù)挖掘技術(shù)(第3版)——應(yīng)用于市場營銷、銷售與客戶關(guān)系管理》、Mastering Data Mining和Mining the Web——這些書籍都側(cè)重于數(shù)據(jù)挖掘和數(shù)據(jù)分析。本書延續(xù)廣受好評的第1版,側(cè)重于如何實際地獲取和解釋數(shù)據(jù)結(jié)果,更具有實踐性。