注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計其他編程語言/工具R語言實戰(zhàn)

R語言實戰(zhàn)

R語言實戰(zhàn)

定 價:¥79.00

作 者: (美)Robert I. Kabacoff 著 高濤,肖楠,陳鋼 譯
出版社: 人民郵電出版社
叢編項:
標 簽: 程序設計 計算機/網絡

ISBN: 9787115299901 出版時間: 2013-03-01 包裝: 平裝
開本: 16開 頁數: 388 字數:  

內容簡介

  數據時代已經到來,但數據分析、數據挖掘人才卻十分短缺。由于“大數據”對每個領域的決定性影響, 相對于經驗和直覺,在商業(yè)、經濟及其他領域中基于數據和分析去發(fā)現問題并作出科學、客觀的決策越來越重要。開源軟件R是世界上最流行的數據分析、統(tǒng)計計算及制圖語言,幾乎能夠完成任何數據處理任務,可安裝并運行于所有主流平臺,為我們提供了成千上萬的專業(yè)模塊和實用工具,是從大數據中獲取有用信息的絕佳工具?!禦語言實戰(zhàn)》從解決實際問題入手,盡量跳脫統(tǒng)計學的理論闡述來討論R語言及其應用,講解清晰透澈,極具實用性。作者不僅高度概括了R語言的強大功能、展示了各種實用的統(tǒng)計示例,而且對于難以用傳統(tǒng)方法分析的凌亂、不完整和非正態(tài)的數據也給出了完備的處理方法。通讀本書,你將全面掌握使用R語言進行數據分析、數據挖掘的技巧,并領略大量探索和展示數據的圖形功能,從而更加高效地進行分析與溝通。想要成為倍受高科技企業(yè)追捧的、炙手可熱的數據分析師嗎?想要科學分析數據并正確決策嗎?不妨從本書開始,挑戰(zhàn)大數據,用R開始炫酷的數據統(tǒng)計與分析吧!《R語言實戰(zhàn)》內容:R安裝與操作數據導入/導出及格式化雙變量關系的描述性分析回歸分析模型適用性的評價方法以及結果的可視化用圖形實現變量關系的可視化在給定置信度的前提下確定樣本量高級統(tǒng)計分析方法和高級繪圖

作者簡介

  Robert I. KabacoffR語言社區(qū)著名學習網站Quick-Rhttp://www.statmethods.net/)的幕后維護者,現為全球化開發(fā)與咨詢公司Management研究集團研發(fā)副總裁。此前,Kabacoff博士是佛羅里達諾瓦東南大學的教授,講授定量方法和統(tǒng)計編程的研究生課程。Kabacoff還是臨床心理學博士、統(tǒng)計顧問,擅長數據分析,在健康、金融服務、制造業(yè)、行為科學、政府和學術界有20余年的研究和統(tǒng)計咨詢經驗。

圖書目錄

目 錄 第一部分 入門 第1章 R語言介紹 
1.1 為何要使用R? 
1.2 R的獲取和安裝 
1.3 R的使用 
1.3.1 新手上路 
1.3.2 獲取幫助 
1.3.3 工作空間 
1.3.4 輸入和輸出 
1.4 包 
1.4.1 什么是包 
1.4.2 包的安裝 
1.4.3 包的載入 
1.4.4 包的使用方法 
1.5 批處理 
1.6 將輸出用為輸入——結果的重用 
1.7 處理大數據集 
1.8 示例實踐 
1.9 小結  第2章 創(chuàng)建數據集 
2.1 數據集的概念 
2.2 數據結構 
2.2.1 向量 
2.2.2 矩陣 
2.2.3 數組 
2.2.4 數據框 
2.2.5 因子 
2.2.6 列表 
2.3 數據的輸入 
2.3.1 使用鍵盤輸入數據 
2.3.2 從帶分隔符的文本文件導入數據 
2.3.3 導入Excel數據 
2.3.4 導入XML數據 
2.3.5 從網頁抓取數據 
2.3.6 導入SPSS數據 
2.3.7 導入SAS數據 
2.3.8 導入Stata數據 
2.3.9 導入netCDF數據 
2.3.10 導入HDF5數據 
2.3.11 訪問數據庫管理系統(tǒng) 
2.3.12 通過Stat/Transfer導入數據 
2.4 數據集的標注 
2.4.1 變量標簽 
2.4.2 值標簽 
2.5 處理數據對象的實用函數 
2.6 小結  第3章 圖形初階 
3.1 使用圖形 
3.2 一個簡單的例子 
3.3 圖形參數 
3.3.1 符號和線條 
3.3.2 顏色 
3.3.3 文本屬性 
3.3.4 圖形尺寸與邊界尺寸 
3.4 添加文本、自定義坐標軸和圖例 
3.4.1 標題 
3.4.2 坐標軸 
3.4.3 參考線 
3.4.4 圖例 
3.4.5 文本標注 
3.5 圖形的組合 
3.6 小結  第4章 基本數據管理 
4.1 一個示例 
4.2 創(chuàng)建新變量 
4.3 變量的重編碼 
4.4 變量的重命名 
4.5 缺失值 
4.5.1 重編碼某些值為缺失值 
4.5.2 在分析中排除缺失值 
4.6 日期值 
4.6.1 將日期轉換為字符型變量 
4.6.2 更進一步 
4.7 類型轉換 
4.8 數據排序 
4.9 數據集的合并 
4.9.1 添加列 
4.9.2 添加行 
4.10 數據集取子集 
4.10.1 選入(保留)變量 
4.10.2 剔除(丟棄)變量 
4.10.3 選入觀測 
4.10.4 subset()函數 
4.10.5 隨機抽樣 
4.11 使用SQL語句操作數據框 
4.12 小結  第5章 高級數據管理 
5.1 一個數據處理難題 
5.2 數值和字符處理函數 
5.2.1 數學函數 
5.2.2 統(tǒng)計函數 
5.2.3 概率函數 
5.2.4 字符處理函數 
5.2.5 其他實用函數 
5.2.6 將函數應用于矩陣和數據框 
5.3 數據處理難題的一套解決方案 
5.4 控制流 
5.4.1 重復和循環(huán) 
5.4.2 條件執(zhí)行 
5.5 用戶自編函數 
5.6 整合與重構 
5.6.1 轉置 
5.6.2 整合數據 
5.6.3 reshape包 
5.7 小結  第二部分 基本方法 第6章 基本圖形 
6.1 條形圖 
6.1.1 簡單的條形圖 
6.1.2 堆砌條形圖和分組條形圖 
6.1.3 均值條形圖 
6.1.4 條形圖的微調 
6.1.5 棘狀圖 
6.2 餅圖 
6.3 直方圖 
6.4 核密度圖 
6.5 箱線圖 
6.5.1 使用并列箱線圖進行跨組比較 
6.5.2 小提琴圖 
6.6 點圖 
6.7 小結  第7章 基本統(tǒng)計分析 
7.1 描述性統(tǒng)計分析 
7.1.1 方法云集 
7.1.2 分組計算描述性統(tǒng)計量 
7.1.3 結果的可視化 
7.2 頻數表和列聯(lián)表 
7.2.1 生成頻數表 
7.2.2 獨立性檢驗 
7.2.3 相關性的度量 
7.2.4 結果的可視化 
7.2.5 將表轉換為扁平格式 
7.3 相關 
7.3.1 相關的類型 
7.3.2 相關性的顯著性檢驗 
7.3.3 相關關系的可視化 
7.4 t檢驗 
7.4.1 獨立樣本的t檢驗 
7.4.2 非獨立樣本的t檢驗 
7.4.3 多于兩組的情況 
7.5 組間差異的非參數檢驗 
7.5.1 兩組的比較 
7.5.2 多于兩組的比較 
7.6 組間差異的可視化 
7.7 小結  第三部分 中級方法 第8章 回歸 
8.1 回歸的多面性 
8.1.1 OLS回歸的適用情境 
8.1.2 基礎回顧 
8.2 OLS回歸 
8.2.1 用lm()擬合回歸模型 
8.2.2 簡單線性回歸 
8.2.3 多項式回歸 
8.2.4 多元線性回歸 
8.2.5 有交互項的多元線性回歸 
8.3 回歸診斷 
8.3.1 標準方法 
8.3.2 改進的方法 
8.3.3 線性模型假設的綜合驗證 
8.3.4 多重共線性 
8.4 異常觀測值 
8.4.1 離群點 
8.4.2 高杠桿值點 
8.4.3 強影響點 
8.5 改進措施 
8.5.1 刪除觀測點 
8.5.2 變量變換 
8.5.3 增刪變量 
8.5.4 嘗試其他方法 
8.6 選擇“最佳”的回歸模型 
8.6.1 模型比較 
8.6.2 變量選擇 
8.7 深層次分析 
8.7.1 交叉驗證 
8.7.2 相對重要性 
8.8 小結  第9章 方差分析 
9.1 術語速成 
9.2 ANOVA模型擬合 
9.2.1 aov()函數 
9.2.2 表達式中各項的順序 
9.3 單因素方差分析 
9.3.1 多重比較 
9.3.2 評估檢驗的假設條件 
9.4 單因素協(xié)方差分析 
9.4.1 評估檢驗的假設條件 
9.4.2 結果可視化 
9.5 雙因素方差分析 
9.6 重復測量方差分析 
9.7 多元方差分析 
9.7.1 評估假設檢驗 
9.7.2 穩(wěn)健多元方差分析 
9.8 用回歸來做ANOVA 
9.9 小結  第10章 功效分析 
10.1 假設檢驗速覽 
10.2 用pwr包做功效分析 
10.2.1 t檢驗 
10.2.2 方差分析 
10.2.3 相關性 
10.2.4 線性模型 
10.2.5 比例檢驗 
10.2.6 卡方檢驗 
10.2.7 在新情況中選擇合適的效應值 
10.3 繪制功效分析圖形 
10.4 其他軟件包 
10.5 小結  第11章 中級繪圖 
11.1 散點圖 
11.1.1 散點圖矩陣 
11.1.2 高密度散點圖 
11.1.3 三維散點圖 
11.1.4 氣泡圖 
11.2 折線圖 
11.3 相關圖 
11.4 馬賽克圖 
11.5 小結  第12章 重抽樣與自助法 
12.1 置換檢驗 
12.2 用coin包做置換檢驗 
12.2.1 獨立兩樣本和K樣本檢驗 
12.2.2 列聯(lián)表中的獨立性 
12.2.3 數值變量間的獨立性 
12.2.4 兩樣本和K樣本相關性檢驗 
12.2.5 深入探究 
12.3 lmPerm包的置換檢驗 
12.3.1 簡單回歸和多項式回歸 
12.3.2 多元回歸 
12.3.3 單因素方差分析和協(xié)方差分析 
12.3.4 雙因素方差分析 
12.4 置換檢驗點評 
12.5 自助法 
12.6 boot包中的自助法 
12.6.1 對單個統(tǒng)計量使用自助法 
12.6.2 多個統(tǒng)計量的自助法 
12.7 小結  第四部分 高級方法 第13章 廣義線性模型 
13.1 廣義線性模型和glm()函數 
13.1.1 glm()函數 
13.1.2 連用的函數 
13.1.3 模型擬合和回歸診斷 
13.2 Logistic回歸 
13.2.1 解釋模型參數 
13.2.2 評價預測變量對結果概率的影響 
13.2.3 過度離勢 
13.2.4 擴展 
13.3 泊松回歸 
13.3.1 解釋模型參數 
13.3.2 過度離勢 
13.3.3 擴展 
13.4 小結  第14章 主成分和因子分析 
14.1 R中的主成分和因子分析 
14.2 主成分分析 
14.2.1 判斷主成分的個數 
14.2.2 提取主成分 
14.2.3 主成分旋轉 
14.2.4 獲取主成分得分 
14.3 探索性因子分析 
14.3.1 判斷需提取的公共因子數 
14.3.2 提取公共因子 
14.3.3 因子旋轉 
14.3.4 因子得分 
14.3.5 其他與EFA相關的包 
14.4 其他潛變量模型 
14.5 小結  第15章 處理缺失數據的高級方法 
15.1 處理缺失值的步驟 
15.2 識別缺失值 
15.3 探索缺失值模式 
15.3.1 列表顯示缺失值 
15.3.2 圖形探究缺失數據 
15.3.3 用相關性探索缺失值 
15.4 理解缺失數據的來由和影響 
15.5 理性處理不完整數據 
15.6 完整實例分析(行刪除) 
15.7 多重插補 
15.8 處理缺失值的其他方法 
15.8.1 成對刪除 
15.8.2 簡單(非隨機)插補 
15.9 小結  第16章 高級圖形進階 
16.1 R中的四種圖形系統(tǒng) 
16.2 lattice包 
16.2.1 條件變量 
16.2.2 面板函數 
16.2.3 分組變量 
16.2.4 圖形參數 
16.2.5 頁面擺放 
16.3 ggplot2包 
16.4 交互式圖形 
16.4.1 與圖形交互:鑒別點 
16.4.2 playwith 
16.4.3 latticist 
16.4.4 iplots包的交互圖形 
16.4.5 rggobi 
16.5 小結  后記:探索R的世界  附錄A 圖形用戶界面 
附錄B 自定義啟動環(huán)境 
附錄C 從R中導出數據 
附錄D 制作出版級品質的輸出 
附錄E R中的矩陣運算 
附錄F 本書中用到的擴展包 
附錄G 處理大數據 
附錄H 更新R  參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號