注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計其他編程語言/工具集體智慧編程

集體智慧編程

集體智慧編程

定 價:¥59.80

作 者: (美)西格蘭 著,莫映,王開福 譯
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 程序設計

購買這本書可以去


ISBN: 9787121075391 出版時間: 2009-01-01 包裝: 平裝
開本: 16開 頁數: 334 字數:  

內容簡介

  《集體智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)以機器學習與計算統計為主題背景,專門講述如何挖掘和分析Web上的數據和資源,如何分析用戶體驗、市場營銷、個人品味等諸多信息,并得出有用的結論,通過復雜的算法來從Web網站獲取、收集并分析用戶的數據和反饋信息,以便創(chuàng)造新的用戶價值和商業(yè)價值。全書內容翔實,包括協作過濾技術(實現關聯產品推薦功能)、集群數據分析(在大規(guī)模數據集中發(fā)掘相似的數據子集)、搜索引擎核心技術(爬蟲、索引、查詢引擎、PageRank算法等)、搜索海量信息并進行分析統計得出結論的優(yōu)化算法、貝葉斯過濾技術(垃圾郵件過濾、文本過濾)、用決策樹技術實現預測和決策建模功能、社交網絡的信息匹配技術、機器學習和人工智能應用等?!都w智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)向讀者介紹了:令在線零售商向用戶提供商品或媒體推薦的協作型過濾技術;在一個大型數據集中檢測相似項群組的聚類方法;在針對某一問題的數以百萬計的可能題解中進行搜索,并從中選出最優(yōu)解的優(yōu)化算法;用于垃圾過濾技術的貝葉斯過濾器,如何根據單詞類型及其他特征對文檔進行分類;用于對在線約會站點的用戶進行配對的支持向量機;用于問題求解的智能進化技術——隨著玩游戲的次數逐漸增多,計算機玩家如何通過改進自身代碼的方式來發(fā)展技能。《集體智慧編程》(Programming Collective Intelligence Building Smart Web 2.0 Applications)的每一章后都有練習,這些練習對算法進行了擴展,使其變得更加強大。讓我們超越以數據庫為后端的簡單應用系統,挖掘互聯網數據的價值,為我所用!深入講解蘊藏于智能Web 2.0應用背后的算法原理,介紹挖掘和分析用戶貢獻的內容,以創(chuàng)造新的用戶價值和商業(yè)價值。

作者簡介

  Toby Segaran是Genstruct公司的軟件開發(fā)主管,這家公司涉足計算生物領域,他本人的職責是設計算法,并利用數據挖掘技術來輔助了解藥品機理。Toby Segaran還為其他幾家公司和數個開源項目服務,幫助它們從收集到的數據當中分析并發(fā)掘價值。除此以外,TobySegaran還建立了幾個免費的網站應用,包括流行的tasktoy和Lazybase。他非常喜歡滑雪與品酒,其博客地址是bl09.kiwitobes.corn,現居于舊金山。

圖書目錄

前言
第1章 集體智慧導言
什么是集體智慧
什么是機器學習
機器學習的局限
真實生活中的例子
學習型算法的其他用途
第2章 提供推薦
協作型過濾
搜集偏好
尋找相近的用戶
推薦物品
匹配商品
構建一個基于del.icio.us的鏈接推薦系統
基于物品的過濾
使用MovieLens數據集
基于用戶進行過濾還是基于物品進行過濾
練習
第3章 發(fā)現群組
監(jiān)督學習和無監(jiān)督學習
單詞向量
分級聚類
繪制樹狀圖
列聚類
K-均值聚類
針對偏好的聚類
以二維形式展現數據
有關聚類的其他事宜
練習
第4章 搜索與排名
搜索引擎的組成
一個簡單的爬蟲程序
建立索引
查詢
基于內容的排名
利用外部回指鏈接
從點擊行為中學習
練習
第5章 優(yōu)化
組團旅游
描述題解
成本函數
隨機搜索
爬山法
模擬退火算法
遺傳算法
真實的航班搜索
涉及偏好的優(yōu)化
網絡可視化
其他可能的應用場合
練習
第6章 文檔過濾
過濾垃圾信息
文檔和單詞
對分類器進行訓練
計算概率
樸素分類器
費舍爾方法
將經過訓練的分類器持久化
過濾博客訂閱源
對特征檢測的改進
使用Akismet
替代方法
練習
第7章 決策樹建模
預測注冊用戶
引入決策樹
對樹進行訓練
選擇最合適的拆分方案
以遞歸方式構造樹
決策樹的顯示
對新的觀測數據進行分類
決策樹的剪枝
處理缺失數據
處理數值型結果
對住房價格進行建模
對“熱度”評價進行建模
什么時候使用決策樹
練習
第8章 構建價格模型
構造一個樣本數據集
k-最近鄰算法
為近鄰分配權重
交叉驗證
不同類型的變量
對縮放結果進行優(yōu)化
不對稱分布
使用真實數據——eBay API
何時使用k-最近鄰算法
練習
第9章 高階分類:核方法與SVM
婚介數據集
數據中的難點
基本的線性分類
分類特征
對數據進行縮放處理
理解核方法
支持向量機
使用LIBSVM
基于Facebook的匹配
練習
第10章 尋找獨立特征
搜集一組新聞
先前的方法
非負矩陣因式分解
結果呈現
利用股票市場的數據
練習
第11章 智能進化
什么是遺傳編程
將程序以樹形方式表示
構造初始種群
測試題解
對程序進行變異
交叉
構筑環(huán)境
一個簡單的游戲
更多可能性
練習
第12章 算法總結
貝葉斯分類器
決策樹分類器
神經網絡
支持向量機
k-最近鄰
聚類
多維縮放
非負矩陣因式分解
優(yōu)化
附錄A:第三方函數庫
附錄B:數學公式
索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號