注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Pandas數(shù)據(jù)分析實(shí)戰(zhàn)

Pandas數(shù)據(jù)分析實(shí)戰(zhàn)

Pandas數(shù)據(jù)分析實(shí)戰(zhàn)

定 價(jià):¥128.00

作 者: [美]鮑里斯·帕斯哈弗(Boris Paskhaver)著,殷海英 譯
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302612711 出版時(shí)間: 2022-08-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  主要內(nèi)容 ●對(duì)數(shù)據(jù)集進(jìn)行組織、 分組、合并、分割以及連接 ●發(fā)現(xiàn)基于文本和時(shí)間的數(shù)據(jù)的趨勢 ●對(duì)數(shù)據(jù)進(jìn)行排序、過濾、樞軸化、優(yōu)化,并得出結(jié)論 ●應(yīng)用聚合操作

作者簡介

  Boris Paskhaver是一名軟件工程師、敏捷顧問和在線教育家。已有來自190個(gè)國家的30萬名學(xué)生學(xué)習(xí)了他的編程課程。

圖書目錄

第Ⅰ部分   Pandas核心基礎(chǔ) 
第1章  Pandas概述 2
1.1  21世紀(jì)的數(shù)據(jù) 2
1.2  Pandas介紹 3
1.2.1  Pandas與圖形電子表格應(yīng)用程序 4
1.2.2  Pandas與它的競爭對(duì)手 5
1.3  Pandas之旅 6
1.3.1  導(dǎo)入數(shù)據(jù)集 6
1.3.2  操作DataFrame 8
1.3.3  計(jì)算Series中的值 11
1.3.4  根據(jù)一個(gè)或多個(gè)條件篩選列 12
1.3.5  對(duì)數(shù)據(jù)分組 14
1.4  本章小結(jié) 17
第2章  Series對(duì)象 18
2.1  Series概述 18
2.1.1  類和實(shí)例 19
2.1.2  用值填充Series對(duì)象 19
2.1.3  自定義Series索引 21
2.1.4  創(chuàng)建有缺失值的Series 24
2.2  基于其他Python對(duì)象創(chuàng)建Series 24
2.3  Series屬性 26
2.4  檢索第一行和最后一行 28
2.5  數(shù)學(xué)運(yùn)算 30
2.5.1  統(tǒng)計(jì)操作 30
2.5.2  算術(shù)運(yùn)算 36
2.5.3  廣播 38
2.6  將Series傳遞給Python的
內(nèi)置函數(shù) 40
2.7  代碼挑戰(zhàn) 42
2.7.1  問題描述 42
2.7.2  解決方案 42
2.8  本章小結(jié) 44
第3章  Series方法 46
3.1  使用read_csv函數(shù)導(dǎo)入數(shù)據(jù)集 46
3.2  對(duì)Series進(jìn)行排序 51
3.2.1  使用sort_values方法按值排序 51
3.2.2  使用sort_index方法按索引
排序 53
3.2.3  使用nsmallest和nlargest方法
檢索最小值和最大值 55
3.3  使用inplace參數(shù)替換原有Series 56
3.4  使用value_counts方法計(jì)算值的
個(gè)數(shù) 57
3.5  使用apply方法對(duì)每個(gè)Series值
調(diào)用一個(gè)函數(shù) 62
3.6  代碼挑戰(zhàn) 65
3.6.1  問題描述 65
3.6.2  解決方案 65
3.7  本章小結(jié) 67
第4章  DataFrame對(duì)象 68
4.1  DataFrame概述 69
4.1.1  通過字典創(chuàng)建DataFrame 69
4.1.2  通過NumPy ndarray創(chuàng)建
DataFrame 70
4.2  Series和DataFrame的相似之處 72
4.2.1  使用read_csv函數(shù)導(dǎo)入
DataFrame 72
4.2.2  Series和DataFrame的共享與
專有屬性 73
4.2.3  Series和DataFrame的共有方法 75
4.3  對(duì)DataFrame進(jìn)行排序 78
4.3.1  按照單列進(jìn)行排序 78
4.3.2  按照多列進(jìn)行排序 80
4.4  按照索引進(jìn)行排序 81
4.4.1  按照行索引進(jìn)行排序 82
4.4.2  按照列索引進(jìn)行排序 82
4.5  設(shè)置新的索引 83
4.6  從DataFrame中選擇列 84
4.6.1  從DataFrame中選擇單列 84
4.6.2  從DataFrame中選擇多列 85
4.7  從DataFrame中選擇行 86
4.7.1  使用索引標(biāo)簽提取行 87
4.7.2  按索引位置提取行 89
4.7.3  從特定列中提取值 90
4.8  從Series中提取值 93
4.9  對(duì)行或列進(jìn)行重命名 93
4.10  重置索引 94
4.11  代碼挑戰(zhàn) 96
4.11.1  問題描述 96
4.11.2  解決方案 96
4.12  本章小結(jié) 99
第5章  對(duì)DataFrame進(jìn)行過濾 100
5.1  優(yōu)化數(shù)據(jù)集以提高內(nèi)存
使用效率 100
5.2  按單個(gè)條件過濾 106
5.3  按多個(gè)條件過濾 109
5.3.1  AND條件 109
5.3.2  OR條件 110
5.3.3  ~條件 111
5.3.4  布爾型方法 112
5.4  按條件過濾 112
5.4.1  isin方法 113
5.4.2  between方法 113
5.4.3  isnull和notnull方法 115
5.4.4  處理空值 117
5.5  處理重復(fù)值 119
5.5.1  duplicated方法 119
5.5.2  drop_duplicates方法 121
5.6  代碼挑戰(zhàn) 123
5.6.1  問題描述 123
5.6.2  解決方案 124
5.7  本章小結(jié) 127
第Ⅱ部分  應(yīng)用Pandas
第6章  處理文本數(shù)據(jù) 130
6.1  字母的大小寫和空格 130
6.2  字符串切片 134
6.3  字符串切片和字符替換 135
6.4  布爾型方法 137
6.5  拆分字符串 139
6.6  代碼挑戰(zhàn) 143
6.6.1  問題描述 143
6.6.2  解決方案 143
6.7  關(guān)于正則表達(dá)式的說明 145
6.8  本章小結(jié) 146
第7章  多級(jí)索引DataFrame 147
7.1  MultiIndex對(duì)象 148
7.2  MultiIndex DataFrame 151
7.3  對(duì)MultiIndex進(jìn)行排序 156
7.4  通過MultiIndex提取列或行 159
7.4.1  提取一列或多列 160
7.4.2  使用loc提取一行或多行 162
7.4.3  使用iloc提取一行或多行 166
7.5  交叉選擇 168
7.6  索引操作 169
7.6.1  重置索引 169
7.6.2  設(shè)置索引 172
7.7  代碼挑戰(zhàn) 174
7.7.1  問題描述 174
7.7.2  解決方案 175
7.8  本章小結(jié) 177
第8章  數(shù)據(jù)集的重塑和透視 178
8.1  寬數(shù)據(jù)和窄數(shù)據(jù) 178
8.2  由DataFrame創(chuàng)建數(shù)據(jù)透視表 180
8.2.1  pivot_table方法 180
8.2.2  數(shù)據(jù)透視表的其他選項(xiàng) 184
8.3  對(duì)索引級(jí)別進(jìn)行堆疊和取消
堆疊 186
8.4  融合數(shù)據(jù)集 188
8.5  展開值列表 191
8.6  代碼挑戰(zhàn) 193
8.6.1  問題描述 193
8.6.2  解決方案 194
8.7  本章小結(jié) 197
第9章  GroupBy對(duì)象 198
9.1  從頭開始創(chuàng)建GroupBy對(duì)象 198
9.2  從數(shù)據(jù)集中創(chuàng)建GroupBy對(duì)象 200
9.3  GroupBy對(duì)象的屬性和方法 202
9.4  聚合操作 206
9.5  將自定義操作應(yīng)用于所有組 209
9.6  按多列分組 210
9.7  代碼挑戰(zhàn) 211
9.7.1  問題描述 211
9.7.2  解決方案 212
9.8  本章小結(jié) 214
第10章  合并與連接 215
10.1  本章使用的數(shù)據(jù)集 216
10.2  連接數(shù)據(jù)集 218
10.3  連接后的DataFrame中的
缺失值 220
10.4  左連接 222
10.5  內(nèi)連接 223
10.6  外連接 225
10.7  合并索引標(biāo)簽 228
10.8  代碼挑戰(zhàn) 229
10.8.1  問題描述 231
10.8.2  解決方案 231
10.9  本章小結(jié) 233
第11章  處理日期和時(shí)間 235
11.1  引入Timestamp對(duì)象 235
11.1.1  Python如何處理日期時(shí)間型
數(shù)據(jù) 235
11.1.2  Pandas 如何處理日期時(shí)間型
數(shù)據(jù) 238
11.2  在DatetimeIndex中存儲(chǔ)多個(gè)
時(shí)間戳 240
11.3  將列或索引值轉(zhuǎn)換為日期
時(shí)間類型數(shù)據(jù) 242
11.4  使用DatetimeProperties對(duì)象 243
11.5  使用持續(xù)時(shí)間進(jìn)行加減 247
11.6  日期偏移 249
11.7  Timedelta對(duì)象 251
11.8  代碼挑戰(zhàn) 255
11.8.1  問題描述 256
11.8.2  解決方案 257
11.9  本章小結(jié) 260
第12章  導(dǎo)入和導(dǎo)出 261
12.1  讀取和寫入JSON文件 262
12.1.1  將JSON文件加載到
DataFrame中 263
12.1.2  將DataFrame導(dǎo)出到
JSON文件 269
12.2  讀取和寫入CSV文件 270
12.3  讀取和寫入Excel工作簿 272
12.3.1  在Anaconda環(huán)境中安裝
xlrd和openpyxl庫 272
12.3.2  導(dǎo)入Excel工作簿 272
12.3.3  導(dǎo)出Excel工作簿 275
12.4  代碼挑戰(zhàn) 277
12.4.1  問題描述 278
12.4.2  解決方案 278
12.5  本章小結(jié) 279
第13章  配置Pandas 280
13.1  獲取和設(shè)置Pandas選項(xiàng) 280
13.2  精度 284
13.3  列的最大寬度 285
13.4  截?cái)嚅撝?286
13.5  上下文選項(xiàng) 286
13.6  本章小結(jié) 287
第14章  可視化 289
14.1  安裝Matplotlib 289
14.2  折線圖 290
14.3  條形圖 294
14.4  餅圖 296
14.5  本章小結(jié) 297
附錄A  安裝及配置 298
附錄B  Python速成課程 314
附錄C  NumPy速成教程 346
附錄D  用Faker生成模擬數(shù)據(jù) 353
附錄E  正則表達(dá)式 359

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)