注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘?qū)嵺`:計(jì)算機(jī)科學(xué)叢書

數(shù)據(jù)挖掘?qū)嵺`:計(jì)算機(jī)科學(xué)叢書

數(shù)據(jù)挖掘?qū)嵺`:計(jì)算機(jī)科學(xué)叢書

定 價(jià):¥39.00

作 者: (美)Olivia Parr Rud著;朱揚(yáng)勇等譯;朱揚(yáng)勇譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)庫(kù)技術(shù)叢書
標(biāo) 簽: 數(shù)據(jù)庫(kù)存儲(chǔ)與管理

ISBN: 9787111122210 出版時(shí)間: 2003-09-01 包裝: 膠版紙
開本: 26cm 頁數(shù): 314 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  OliviaParrRud是DataSquare,LLC的執(zhí)行副總裁。Olivia在金融服務(wù)行業(yè)已經(jīng)工作了二十多年,其中10年專門從事信用卡、保險(xiǎn)、電信、零售、度假業(yè)、名錄服務(wù)行業(yè)的數(shù)據(jù)挖掘、建模和劃分工作。利用自己分析能力與創(chuàng)造才華,她提供客戶獲取、模型維護(hù)、風(fēng)險(xiǎn)、總盈利等方面的分析和解決方案。本書詳細(xì)介紹了一種新的數(shù)據(jù)挖掘技術(shù)—數(shù)據(jù)建模,并著重闡述整個(gè)模型開發(fā)過程的細(xì)節(jié)。本書包括三個(gè)部分。第一部分講述了基礎(chǔ)知識(shí),內(nèi)容涉及確定目標(biāo)和從商業(yè)預(yù)測(cè)中定義目標(biāo)的重要性,并給出了收集數(shù)據(jù)和創(chuàng)建數(shù)據(jù)集的例子。第二部分通過一實(shí)例詳?shù)殛U述了模型開發(fā)的整個(gè)過程。第三部分通過應(yīng)用于保險(xiǎn)業(yè)、銀行、電信行業(yè)的實(shí)例詳細(xì)說明了不同目標(biāo)的數(shù)據(jù)建模過程中的幾個(gè)關(guān)鍵步驟。本書將數(shù)據(jù)挖掘的技藝用飲食烹調(diào)的思?爰右在故?,易诱O斫?,遍斦V郵堋J櫓懈齙鬧詼嗍道浞痔逑至俗髡叨嗄甑男幸稻?,毒壉前的手C∮涂突Ч叵倒芾斫>哂屑訓(xùn)慕杓饔謾1臼槭屎暇哂幸歡ǖ耐臣坪頭治黿;〉畝琳咴畝?,可作为分析师、数据驼a蛉嗽?、营销经理的工佐|植?,也可作为紦溷机相关专覚n謀究粕?,研究生綖┠幌娿^潿廖鎩?"什么是數(shù)據(jù)挖掘數(shù)據(jù)挖掘(datamining)這個(gè)術(shù)語涵蓋了應(yīng)用于各個(gè)行業(yè)的多種技術(shù)。由于市場(chǎng)份額和利潤(rùn)競(jìng)爭(zhēng)的日趨激烈,數(shù)據(jù)挖掘成為公司在客戶生命周期的各個(gè)階段維持競(jìng)爭(zhēng)力的必要工具。過去,數(shù)據(jù)挖掘的形式之一也稱為數(shù)據(jù)捕撈(datadredging)。這種方法曾被認(rèn)為沒有達(dá)到合格的研究標(biāo)準(zhǔn)。也就是說,研究人員實(shí)際上可能沒有作任何預(yù)定義的假設(shè)就開始研究所有的數(shù)據(jù)。然而,由于這種形式的數(shù)據(jù)挖掘確實(shí)可以發(fā)現(xiàn)有價(jià)值的信息,所以它開始被廣為接受。在美國(guó)的公司里,如果有一種方法可以發(fā)現(xiàn)如何提高利潤(rùn),那么人們會(huì)迅速地接受、信賴它。20世紀(jì)80年代末至90年代初,另一種形式的數(shù)據(jù)挖掘開始在營(yíng)銷領(lǐng)域流行起來。幾個(gè)技術(shù)領(lǐng)先的信用卡銀行發(fā)現(xiàn),有一種新的稱為數(shù)據(jù)建模(datamodeling)的數(shù)據(jù)挖掘技術(shù)可以提高獲得客戶的能力,改進(jìn)風(fēng)險(xiǎn)管理。大量的活動(dòng)和空前的增長(zhǎng)為數(shù)據(jù)建模的繁榮發(fā)展提供了肥沃的土壤。數(shù)據(jù)建模的成功和它所帶來的利潤(rùn)為它在其他行業(yè)的應(yīng)用鋪平了道路。目前,使用數(shù)據(jù)建模技術(shù)進(jìn)行營(yíng)銷的行業(yè)包括保險(xiǎn)業(yè)、零售業(yè)、投資銀行、公共事業(yè)部門、電信業(yè)、能源業(yè)、度假業(yè)、游戲業(yè)和藥品行業(yè)等等。本書的重點(diǎn)許多統(tǒng)計(jì)理論的書都談到了數(shù)據(jù)建模技術(shù)。但本書并不是那樣的一本書!本書討論的重點(diǎn)是在營(yíng)銷、風(fēng)險(xiǎn)和客戶關(guān)系管理(CRM)中使用這些技術(shù)所需的實(shí)踐知識(shí)。大部分公司都被數(shù)據(jù)挖掘軟件工具?鬧擲嗪凸δ芘醚芻ㄧ月?lián)uH砑潭忌撲塹娜砑恰耙子謔褂謾焙汀拔扌樅魏畏治黽寄堋鋇?。但薁楷晤U且言詒玖煊蜆ぷ鞫嗄輳勒廡┕愀媸遣蛔鬮諾摹H魏謂O钅康某曬Σ喚黿鋈【鲇詼雜詵椒ㄑУ牧己美斫?,还取决釉溤数臼n⑹諧「駝逕桃的勘甑睦斫?。事实上,峨s謖齬潭?,模型揣f砉討皇瞧渲械囊恍〔糠幀?本書將著重闡述整個(gè)模型開發(fā)的過程。討論的內(nèi)容包括對(duì)商業(yè)或市場(chǎng)的預(yù)測(cè),以及處理過程中所需的復(fù)雜的SAS代碼。這是為了強(qiáng)調(diào)實(shí)際模型處理過程之前與之后的步驟的重要性。本書的讀者隨著數(shù)據(jù)挖掘應(yīng)用的飛速發(fā)展,對(duì)資深分析師和數(shù)據(jù)挖掘師的需求也增加了。但是,由于此類人才短缺,公司便雇用有才華的統(tǒng)計(jì)學(xué)家或初級(jí)分析師,他們懂技術(shù),但是缺乏必要的商業(yè)敏感性。公司也可能會(huì)購(gòu)買復(fù)雜的數(shù)據(jù)挖掘軟件工具,這些工具所提供的解決方案對(duì)分析技術(shù)知識(shí),或者與目標(biāo)相關(guān)的業(yè)務(wù)知識(shí)都知之甚少。不管是哪種情況,都有可能缺乏某些領(lǐng)域的知識(shí),如定義目標(biāo)的結(jié)構(gòu),獲取和準(zhǔn)備數(shù)據(jù),確認(rèn)和應(yīng)用模型以及測(cè)量結(jié)果等。任何一個(gè)領(lǐng)域的錯(cuò)誤都可能是災(zāi)難性的,會(huì)造成巨大的浪費(fèi)。本書可作為不同級(jí)別的分析師、數(shù)據(jù)挖掘人員和營(yíng)銷經(jīng)理的工作手冊(cè)。本書提供了數(shù)據(jù)建模的逐步指導(dǎo),尤其強(qiáng)調(diào)了必要的商業(yè)知識(shí),以得到有益的結(jié)果。對(duì)于那些數(shù)據(jù)挖掘的初學(xué)者,本書可作為整個(gè)過程的綜合指導(dǎo)。對(duì)于經(jīng)驗(yàn)豐富的分析師而言,本書可以作為參考手冊(cè)。最后,對(duì)于管理人員而言,閱讀本書可以對(duì)成功運(yùn)用數(shù)據(jù)模型所需的技術(shù)與過程有基本的了解。本書的結(jié)構(gòu)本書分為三個(gè)部分。第一部分講述基礎(chǔ)知識(shí)。第1章討論了確定目標(biāo)和從商業(yè)角度定義目標(biāo)的重要性。第2章討論并提供了大量的例子,其中包括收集數(shù)據(jù)和創(chuàng)建建模數(shù)據(jù)集。第二部分通過一個(gè)案例研究,詳細(xì)闡述了模型開發(fā)過程的每個(gè)步驟。第3章-第7章討論了數(shù)據(jù)清洗、變量歸約和轉(zhuǎn)換、模型處理、驗(yàn)證、實(shí)施的步驟。第三部分提供一系列的案例研究,這些案例分別應(yīng)用于保險(xiǎn)業(yè)、銀行、電信等行業(yè),詳細(xì)說明了不同目標(biāo)的數(shù)據(jù)建模過程的幾個(gè)關(guān)鍵步驟,包括特征、響應(yīng)、風(fēng)險(xiǎn)和生命周期值。隨著本書對(duì)模型開發(fā)步驟的深入探討,作者加進(jìn)了幾位業(yè)內(nèi)專家的合理建議,他們都是數(shù)據(jù)挖掘領(lǐng)域的先鋒。這些建議對(duì)某個(gè)主題提出了不同看法,如多重共線性,建立生命周期值模型的其他方法等。所需工具要使用本書提供解決方案,讀者要對(duì)統(tǒng)計(jì)學(xué)有基本的了解。如果你的目標(biāo)是要得到管理層數(shù)據(jù)建模的使用建議,則需要進(jìn)行準(zhǔn)確的商業(yè)判斷。本書所有的代碼示例都是用SAS寫的,為了在SAS上實(shí)現(xiàn)這些代碼,用戶需要BaseSAS和SAS/STAT。電子數(shù)據(jù)表都是用微軟的Excel做成的。但是,基本的邏輯和指令對(duì)所有的軟件包和建模工具都是有效的。配套光盤本書從第3章—第13章都包含了開發(fā)、驗(yàn)證和實(shí)施數(shù)據(jù)模型的SAS代碼。對(duì)這些代碼稍做修改,再加上一些常識(shí),就能夠從數(shù)據(jù)準(zhǔn)備階段到模型的開發(fā)與驗(yàn)證階段建立一個(gè)模型。但是,這樣需要大量的時(shí)間,還有可能出現(xiàn)編碼錯(cuò)誤。為了簡(jiǎn)化這項(xiàng)工作并使代碼更容易地用于不同的數(shù)據(jù)模型,原出版社出版了配套光盤,但需要讀者另行購(gòu)買。光盤里包括了開發(fā)不同模型所需的全部代碼,模型包括:響應(yīng)、驗(yàn)證、流失、風(fēng)險(xiǎn)、生命周期值或凈現(xiàn)值。開發(fā)目標(biāo)函數(shù)的具體代碼包括信用卡、保險(xiǎn)、電信、名錄服務(wù)的例子。代碼中有清楚的注釋,解釋了每一個(gè)步驟的目的與方法,所需要的軟件是BaseSAS和SAS/STAT。用于創(chuàng)建收益表和增幅圖的電子數(shù)據(jù)表也包含在光盤中。通過SAS創(chuàng)建的初步分析結(jié)果可以得到這些表并加以使用。既然模型處理前后的步驟可以結(jié)合任何數(shù)據(jù)模型軟件包來使用,代碼自然也可以作為獨(dú)立的建模模板。模型處理步驟重點(diǎn)在于邏輯遞歸上的數(shù)據(jù)準(zhǔn)備。光盤上還包括用于變量驗(yàn)證和處理的SAS宏。本書沒有涵蓋的內(nèi)容一本數(shù)據(jù)挖掘的書如果沒有提到隱私權(quán),那么就不能算是完整。我相信這是數(shù)據(jù)挖掘工作者的一項(xiàng)重要的工作。關(guān)于這個(gè)話題,可以再寫一本書。所以,本書中沒有談到這一點(diǎn)。但是,我希望所有使用個(gè)人數(shù)據(jù)進(jìn)行營(yíng)銷的公司都能制訂一項(xiàng)隱私權(quán)的法規(guī)。要獲得更進(jìn)一步的信息和指導(dǎo),請(qǐng)與DirectMarketingAssociation聯(lián)系,電話(212)790-1500,或者訪問他們的網(wǎng)站http://www.the-dma.org。小結(jié)有效的數(shù)據(jù)挖掘是科學(xué)與藝術(shù)的復(fù)雜混合體。數(shù)據(jù)挖掘工具的數(shù)量每年都在增長(zhǎng)。研究人員不斷開發(fā)新方法,軟件廠商實(shí)現(xiàn)現(xiàn)有的方法,才華橫溢的分析師則利用標(biāo)準(zhǔn)技術(shù)來推進(jìn)過程。數(shù)據(jù)挖掘(說得具體一點(diǎn),數(shù)據(jù)建模)已經(jīng)成為公司維持利潤(rùn)的戰(zhàn)略必備工具。希望本書可以成為你實(shí)現(xiàn)數(shù)據(jù)挖掘目標(biāo)時(shí)方便的參考和恰當(dāng)?shù)南驅(qū)А?quot;

作者簡(jiǎn)介

  OliviaParrRud是DataSquare,LLC的執(zhí)行副總裁。Olivia在金融服務(wù)行業(yè)已經(jīng)工作了二十多年,其中10年專門從事信用卡、保險(xiǎn)、電信、零售、度假業(yè)、名錄服務(wù)行業(yè)的數(shù)據(jù)挖掘、建模和劃分工作。利用自己分析能力與創(chuàng)造才華,她提供客戶獲取、模型維護(hù)、風(fēng)險(xiǎn)、總盈利等方面的分析和解決方案。

圖書目錄

譯者序
對(duì)本書的贊譽(yù)

前言
作者介紹
第一部分 計(jì)劃菜單
第1章 設(shè)立目標(biāo)
1.1 定義目標(biāo)
1.1.1 特征分析
1.1.2 劃分
1.1.3 響應(yīng)
1.1.4 風(fēng)險(xiǎn)
1.1.5 激活
1.1.6 交叉銷售和提升銷售
1.1.7 流失
1.1.8 凈現(xiàn)值
1.1.9 生命周期價(jià)值
1.2 選擇建模方法
1.2.1 線性回歸
1.2.2 邏輯回歸
1.2.3 神經(jīng)網(wǎng)絡(luò)
1.2.4 遺傳算法
1.2.5 分類樹
1.3 自適應(yīng)公司
1.3.1 雇傭和合作
1.3.2 以產(chǎn)品為中心與以客戶為中心
1.4 小結(jié)
第2章 選擇數(shù)據(jù)源
2.1 數(shù)據(jù)類型
2.1.1 人口統(tǒng)計(jì)學(xué)數(shù)據(jù)一般描述個(gè)人或家庭特征
2.1.2 行為數(shù)據(jù)是行動(dòng)或行為的一種度量
2.1.3 心理或態(tài)度數(shù)據(jù)以觀點(diǎn)、生活方式
2.2 數(shù)據(jù)源
2.2.1 內(nèi)部數(shù)據(jù)源
2.2.2 外部數(shù)據(jù)源
2.3 選擇建模數(shù)據(jù)
2.3.1 潛在客戶數(shù)據(jù)
2.3.2 客戶模型數(shù)據(jù)
2.3.3 風(fēng)險(xiǎn)模型數(shù)據(jù)
2.4 構(gòu)造建模數(shù)據(jù)集
2.4.1 如何確定樣本尺寸
2.4.2 采樣方法
2.4.3 根據(jù)已建立模型的數(shù)據(jù)開發(fā)模型
2.4.4 集成多個(gè)宣傳活動(dòng)的數(shù)據(jù)
2.5 小結(jié)
第二部分 烹調(diào)演示
第3章 準(zhǔn)備數(shù)據(jù)
3.1 訪問數(shù)據(jù)
3.1.1 數(shù)據(jù)分類
3.1.2 讀原始數(shù)據(jù)
3.2 創(chuàng)建建模數(shù)據(jù)集
3.3 清理數(shù)據(jù)
3.3.1 連續(xù)變量
3.3.2 類型變量
3.4 小結(jié)
第4章 選擇及轉(zhuǎn)換變量
4.1 定義目標(biāo)函數(shù)
4.1.1 激活概率
4.1.2 風(fēng)險(xiǎn)指數(shù)
4.1.3 產(chǎn)品收益率
4.1.4 營(yíng)銷費(fèi)用
4.2 派生變量
4.2.1 概化
4.2.2 比率
4.2.3 日期
4.3 變量歸約
4.3.1 連續(xù)變量
4.3.2 類別變量
4.4 開發(fā)線性預(yù)測(cè)因子
4.4.1 連續(xù)變量
4.4.2 類別變量
4.5 相互作用檢測(cè)
4.6 小結(jié)
第5章 處理和評(píng)價(jià)模型
5.1 處理模型
5.1.1 分割數(shù)據(jù)
5.1.2 方法1:?jiǎn)文P?br />5.1.3 方法2:雙模型——響應(yīng)
5.1.4 方法2:雙模型——激活
5.1.5 方法1與方法2的比較
5.2 小結(jié)
第6章 驗(yàn)證模型
6.1 收益表與收益圖
6.1.1 方法1:?jiǎn)文P?br />6.1.2 方法2:雙模型
6.2 為備用數(shù)據(jù)集評(píng)分
6.3 重新采樣
6.3.1 折疊
6.3.2 自引導(dǎo)
6.4 關(guān)鍵變量的十分位數(shù)分析
6.5 小結(jié)
第7章 實(shí)施與維護(hù)模型
7.1 為新文件評(píng)分
7.1.1 內(nèi)部評(píng)分
7.1.2 外部評(píng)分與審計(jì)
7.2 實(shí)施模型
7.2.1 計(jì)算機(jī)財(cái)務(wù)狀況
7.2.2 決定文件分割點(diǎn)
7.2.3 衛(wèi)冕者與挑戰(zhàn)者
7.2.4 雙模型矩陣
7.3 模型跟蹤
7.4 模型維護(hù)
7.4.1 模型壽命
7.4.2 模型記錄
7.5 小結(jié)
第三部分 每個(gè)節(jié)日的菜肴配方
第8章 了解你的客戶:特征化和劃分
8.1 為什么了解客戶很重要
8.2 目錄服務(wù)公司客戶的特征化昨滲透分析
8.2.1 RFM分析
8.2.2 滲透分析
8.3 為信用卡公司開發(fā)客戶價(jià)值矩陣
8.4 執(zhí)行聚類分析以發(fā)現(xiàn)客戶劃分
8.5 小結(jié)
第9章 定位新的潛在客戶:響應(yīng)建模
9.1 定義目標(biāo)
9.2 準(zhǔn)備變更
9.2.1 連續(xù)變量
9.2.2 類別變量
9.3 處理模型
9.4 用自引導(dǎo)驗(yàn)證
9.5 實(shí)現(xiàn)模型
9.6 小結(jié)
第10章 避免高風(fēng)險(xiǎn)客戶:風(fēng)險(xiǎn)建模
10.1 信用評(píng)分和風(fēng)險(xiǎn)建模
10.2 定義目標(biāo)
10.3 準(zhǔn)備變量
10.4 處理模型
10.5 驗(yàn)證模型
10.6 實(shí)現(xiàn)模型
10.7 另一種風(fēng)險(xiǎn):欺詐
10.8 小結(jié)
第11章 留信創(chuàng)利客戶:流失建模
11.1 客戶忠誠(chéng)度
11.2 定義目標(biāo)
11.3 準(zhǔn)備變量
11.3.1 連續(xù)變量
11.3.2 類型變量
11.4 處理模型
11.5 驗(yàn)證模型
11.6 實(shí)現(xiàn)模型
11.6.1 建立流失客戶特征
11.6.2 優(yōu)化客戶創(chuàng)利能力
11.6.3 提前保留客戶
11.7 小結(jié)
第12章 定位創(chuàng)利客戶:生命周期價(jià)值建模
12.1 什么是生命周期價(jià)值
12.1.1 使用生命周期價(jià)值
12.1.2 生命周期價(jià)值的組成
12.2 生命周期價(jià)值的應(yīng)用
12.3 為可續(xù)約產(chǎn)品或服務(wù)計(jì)算生命周期價(jià)值
12.4 計(jì)算機(jī)生命周期價(jià)值:案例研究
12.4.1 案例研究:第一年凈收入
12.4.2 生命周期價(jià)值計(jì)算
12.5 小結(jié)
第13章 快餐:Web建模
13.1 Web挖掘和Web建模
13.1.1 定義目標(biāo)
13.1.2 Web數(shù)據(jù)源
13.1.3 準(zhǔn)備Web數(shù)據(jù)
13.1.4 選擇方法學(xué)
13.2 在Web上建立品牌
13.3 實(shí)時(shí)洞察客戶
13.4 Web使用挖掘——案例分析
13.5 小結(jié)
附錄A 連續(xù)變量的單變量分析
附錄B 類別變量的單變量分析
附錄C 推薦閱讀教材

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)