注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫理論數(shù)據(jù)挖掘原理

數(shù)據(jù)挖掘原理

數(shù)據(jù)挖掘原理

定 價:¥48.00

作 者: (英)David Hand,Heikki Mannila,Padhraic Smyth著;張銀奎[等]譯;張銀奎譯
出版社: 機械工業(yè)出版社
叢編項: 計算機科學叢書
標 簽: 數(shù)據(jù)庫存儲與管理

ISBN: 9787111115779 出版時間: 2003-04-01 包裝: 膠版紙
開本: 26cm 頁數(shù): 361 字數(shù):  

內(nèi)容簡介

  COCOMO(ConstructiveCOstModel,構造性成本模型)是一種精確的、易于使用的基于模型的成本估算方法。而COCOMOII是對經(jīng)典COCOMO模型的徹底更新,反映了現(xiàn)代軟件過程與構造方法。本書詳細講解如何利用COCOMOII進行軟件開發(fā)項目管理中的有效估算。書中用大量實例說明COCOMOII的使用方法,涉及軟件成本估算的各個方面。適合軟件開發(fā)人員、管理人員、在校學生參考。各種機構的日常運作日益依賴于客戶化軟件方案的開發(fā),然而,目前一半以上的軟件項目在進度與預算上都超出50%以上。雖然某些類型的超出仍是不可預測的,但是采用恰當?shù)哪P涂梢员苊獯蟛糠謫栴}的發(fā)生。COCOMOII是對經(jīng)典COCOMO模型的徹底更新,反映了現(xiàn)代軟件過程與構造方法,另外還給出了幾個將模型應用于關鍵軟件決策情形的代表性示例。該模型采用創(chuàng)新性的統(tǒng)計學方法進行校準與驗證,從而使模型既符合專家判斷,又與161個認真收集的項目數(shù)據(jù)點相一致。本書也介紹了針對COTS集成、快速開發(fā)成本與進度估算的COCOMOII新擴展。本書特點●從知識淵博的作者那里學到第一手的100多人年的軟件成本估算經(jīng)驗?!裢ㄟ^探索成本的真正含義而做出更好的軟件決策。●采用成本與進度估算,進行更好的項目計劃與控制及風險管理?!窨梢杂酶綆Ч獗P上的軟件馬上開始估算?!裢ㄟ^作者的Web站點跟蹤最新發(fā)展動態(tài)。

作者簡介

  (英)漢德(DavidHand)是倫敦帝國大學數(shù)學系統(tǒng)計學教授。HeikkiMannila是赫爾辛基工業(yè)大學計算科學與工程系的教授,諾基亞研究中心的研究員。PadhraicSmyth是加州大學Lrvine分校信息與計算科學系的副教授。

圖書目錄

第1章  給論
  1.1  數(shù)據(jù)挖掘簡介
  1.2  數(shù)據(jù)集屬性
  1.3  結構類型:模型和模式
  1.4  數(shù)據(jù)挖掘任務
  1.5  數(shù)據(jù)挖掘算法的組件
    1.5.1  評分函數(shù)
    1.5.2  優(yōu)化和搜索方法
    1.5.3  數(shù)據(jù)管理策略
  1.6  統(tǒng)計和數(shù)據(jù)挖掘的相互關系
  1.7  數(shù)據(jù)挖掘:打撈.探查還是垂釣
  1.8  本章歸納
  1.9  補充讀物
第2章  測量和數(shù)據(jù)
  2.1  簡介
  2.2  測量類型
  2.3  距離尺度
  2.4  數(shù)據(jù)轉(zhuǎn)化
  2.5  數(shù)據(jù)形式
  2.6  單個測量的數(shù)據(jù)質(zhì)量
  2.7  數(shù)據(jù)群體的數(shù)據(jù)質(zhì)量
  2.8  本章歸納
  2.9  補充讀物
第3章  可視化和探索數(shù)據(jù)
  3.1  簡介
  3.2  總結數(shù)據(jù):幾個簡單例子
  3.3  顯示單個變量的一些工具
  3.4  顯示兩個變量間關系的工具
  3.5  顯示兩個以上變量間關系的工具
  3.6  主分量分析
  3.7  多維縮放
  3.8     補充讀物
第4章  數(shù)據(jù)分析和不確定性
  4.1  簡介
  4.2  處理不確定性
  4.3  隨機變量和它們的關系
  4.4  樣本和統(tǒng)計推理
  4.5     估計
    4.5.1  估計量的理想屬性
    4.5.2  最大似然估計
    4.5.3  貝葉斯估計
  4.6  假設檢驗
    4.6.1  古典假設檢驗
    4.6.2  數(shù)據(jù)挖掘中的假設檢驗
  4.7  采樣方法
  4.8  本章歸納
  4.9  補充讀物
第5章  數(shù)據(jù)挖掘算法概覽
  5.1  簡介
  5.2  建立樹分類器的CART算法
  5.3  數(shù)據(jù)挖掘算法的化約主義觀點
    5.3.1  用于回歸和分類的多層感知器
    5.3.2  關聯(lián)規(guī)則學習的A  Priori算法
    5.3.3  檢索文本的向量空間算法
  5.4  討論
  5.5  補充讀物
第6章  模型和模式
  6.1  概述
  6.2  建模基礎
  6.3  用于預測的模型結構
    6.3.1  具有線性結構的回歸模型
    6.3.2  用于回歸的局部分段模型結構
    6.3.3  “基于記憶”的非參數(shù)局部模型
    6.3.4  模型結構的隨機部分
    6.3.5  用于分類的預測模型
    6.3.6  選擇適當復雜度的模型
  6.4  概率分布和密度函數(shù)模型
    6.4.1  一般概念
    6.4.2  混合模型
    6.4.3  無序范疇型數(shù)據(jù)的聯(lián)合分布
    6.4.4  因式分解和高維空間中的獨立性
  6.5  維度效應
    6.5.1  高維數(shù)據(jù)的變量選擇
    6.5.2  高維數(shù)據(jù)的變換
  6.6  用于結構化數(shù)據(jù)的模型
  6.7  模式結構
    6.7.1  數(shù)據(jù)矩陣中的模式
    6.7.2  字符串模式
  6.3  參考讀物
第7章  數(shù)據(jù)挖掘算法的評分函數(shù)
  7.1  簡介
  7.2  對模式進行評價
  7.3  預測性評分函數(shù)和描述性評分函數(shù)
    7.3.1  評價預測模型的評分函數(shù)
    7.3.2  評價描述模型的評分函數(shù)
  7.4  評價不同復雜度的模型
    7.4.1  模型比較的一般概念
    7.4.2  再談偏差一方差
    7.4.3  懲罰復雜模型的評分函數(shù)
    7.4.4  使用外部驗證的評分函數(shù)
  7.5  模型和模式的評價
  7.6  魯棒方法
  7.7  補充讀物
第8章  搜索和優(yōu)化方法
  8.1  簡介
  8.2  搜索模型或模式
    8.2.1  搜索背景
    8.2.2  數(shù)據(jù)挖掘中的狀態(tài)空間搜索
    8.2.3  簡單貪婪搜索算法
    8.2.4  系統(tǒng)搜索和搜索啟示
    8.2.5  分支定界法
  8.3  參數(shù)優(yōu)化方法
    8.3.1  參數(shù)優(yōu)化:背景
    8.3.2  閉合形式解和線性代數(shù)方法
    8.3.3  優(yōu)化平滑函數(shù)的基于梯度方法
    8.3.4  一元參數(shù)優(yōu)化
    8.3.5  多元參數(shù)優(yōu)化
    8.3.6  約束優(yōu)化
  8.4  存在殘缺數(shù)據(jù)時的優(yōu)化:EM算法
  8.5  在線和單掃描算法
  8.6  隨機搜索和優(yōu)化技術
  8.7  補充讀物
第9章  描述建模
  9.1  簡介
  9.2  通過概率分布和密度描述數(shù)據(jù)
    9.2.1  簡介
    9.2.2  用來估計概率分布和密度的評分函數(shù)
    9.2.3  參數(shù)密度模型
    9.2.4  混合分布和密度
    9.2.5  混合模型的EM算法
    9.2.6  非參數(shù)的密度估計
    9.2.7  范疇型數(shù)據(jù)的聯(lián)合分布
  9.3  聚類分析背景
  9.4  基于劃分的聚類算法
    9.4.1  基于劃分聚類的評分函數(shù)
    9.4.2  基于劃分聚類的基本算法
  9.5  層次聚類
    9.5.1  凝聚方法
    9.5.2  分裂方法
  9.6  基于混合模型的概率聚類
  9.7  補充讀物
第10章  用于分類的預測建模
  10.1  預測建模概覽
  10.2  分類建模簡介
    10.2.1  判別分類和決策邊界
    10.2.2  分類的概率模型
    10.2.3  建立實際的分類器
  10.3  感知器
  10.4  線性判別式
  10.5  樹模型
  10.6  最近鄰方法
  10.7  1ogistic判別式分析
  10.8  樸素貝葉斯模型
  10.9  其他方法
  10.10  分類器的評估和比較
  10.11  高維分類的特征選取
  10.12  補充讀物
第11章  用于回歸的預測建模
  11.1  簡介
  11.2  線性模型和最小二乘法擬合
    11.2.1  擬合模型的計算問題
    11.2.2  線性回歸的概率解釋
    11.2.3  擬合后模型的解釋
    11.2.4  推理和泛化
    11.2.5  模型搜索和建模
    11.2.6  模型診斷和審查
  11.3  推廣的線性模型
  11.4  人工神經(jīng)網(wǎng)絡
  11.5  其他高度參數(shù)化的模型
    11.5.1  推廣的相加模型
    11.5.2  投影追蹤回歸
  11.6  補充讀物
第12章  數(shù)據(jù)組織和數(shù)據(jù)庫
  12.1  簡介
  12.2  存儲器層次
  12.3  索引結構
    12.3.1  B-樹
    12.3.2  哈希索引
  12.4  多維索引
  12.5  關系數(shù)據(jù)庫
  12.6  操縱表格
  12.7  結構化查詢語言
  12.8  查詢的執(zhí)行和優(yōu)化
  12.9  數(shù)據(jù)倉庫和在線分析處理
  12.10  O1AP的數(shù)據(jù)結構
  12.11  字符串數(shù)據(jù)庫
  12.12  海量數(shù)據(jù)集.數(shù)據(jù)管理和數(shù)據(jù)挖掘
    12.12.1  把數(shù)據(jù)都放入主存儲器
    12.12.2  數(shù)據(jù)挖掘算法的可伸縮版本
    12.12.3  考慮磁盤訪問的有針對性算法
    12.12.4  偽數(shù)據(jù)集和充分統(tǒng)計量
  12.13  補充讀物
第13章  尋找模式和規(guī)則
  13.1  簡介
  13.2  規(guī)則表示
  13.3  頻繁項集和關聯(lián)規(guī)則
    13.3.1  簡介
    13.3.2  尋找頻繁集和關聯(lián)規(guī)則
  13.4  推廣
  13.5  尋找序列中的片段
  13.6  選擇發(fā)現(xiàn)的模式和規(guī)則
    13.6.1  簡介
    13.6.2  尋找模式的啟發(fā)式搜索
    13.6.3  有趣度標準
  13.7  從局部模式到全局模型
  13.8  預測規(guī)則歸納
  13.9  補充讀物
第14章  根據(jù)內(nèi)容檢索
  14.1  簡介
  14.2  檢索系統(tǒng)的評價
    14.2.1  評價檢索性能的困難之處
    14.2.2  查準率對查全率
    14.2.3  查準率和查全率的實踐應用
  14.3  文本檢索
    14.3.1  文本的表示
    14.3.2  匹配查詢和文檔
    14.3.3  隱含語義索引
    14.3.4  文檔和文本分類
  14.4  對個人偏好建模
    14.4.1  相關性反饋
    14.4.2  自動推薦系統(tǒng)
  14.5  圖像檢索
    14.5.1  圖像理解
    14.5.2  圖像表示
    14.5.3  圖像查詢
    14.5.4  圖像恒定性
    14.5.5  圖像檢索的推廣
  14.6  時間序列和序列檢索
    14.6.1  時間序列數(shù)據(jù)的全局模型
    14.6.2  時間序列的結構和形狀
  14.7  本章歸納
  14.8  補充讀物
附錄  隨機變量
參考文獻
索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號