注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)從入門(mén)到精通

Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)從入門(mén)到精通

Python網(wǎng)絡(luò)爬蟲(chóng)開(kāi)發(fā)從入門(mén)到精通

定 價(jià):¥79.00

作 者: 劉延林
出版社: 北京大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787301309094 出版時(shí)間: 2019-12-01 包裝:
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)共分 3 篇,針對(duì) Python 爬蟲(chóng)初學(xué)者,從零開(kāi)始,系統(tǒng)地講解了如何利用 Python 進(jìn)行常見(jiàn)的網(wǎng)絡(luò)爬蟲(chóng)的程序開(kāi)發(fā)。第 1 篇快速入門(mén)篇(第 1 章 ~ 第 9 章):本篇主要介紹了 Python 環(huán)境的搭建和一些 Python 的基礎(chǔ)語(yǔ)法知識(shí)等、Python爬蟲(chóng)入門(mén)知識(shí)及基本的使用方法、Ajax 數(shù)據(jù)的分析和抓取、動(dòng)態(tài)渲染頁(yè)面數(shù)據(jù)的爬取、網(wǎng)站代理的設(shè)置與使用、驗(yàn)證碼的識(shí)別與破解,以及 App 數(shù)據(jù)抓取、數(shù)據(jù)的存儲(chǔ)方法等內(nèi)容。第 2 篇技能進(jìn)階篇(第 10 章 ~ 第 12 章):本篇主要介紹了 PySpider 和 Scrapy 兩個(gè)常用爬蟲(chóng)框架的基本使用方法、分布式爬蟲(chóng)的實(shí)現(xiàn)思路,以及數(shù)據(jù)分析、數(shù)據(jù)清洗常用庫(kù)的使用方法。第 3 篇項(xiàng)目實(shí)戰(zhàn)篇(第 13 章):本篇通過(guò) 6 個(gè)綜合實(shí)戰(zhàn)項(xiàng)目,詳細(xì)地講解了 Python 數(shù)據(jù)爬蟲(chóng)開(kāi)始與實(shí)戰(zhàn)應(yīng)用。本篇對(duì)全書(shū)內(nèi)容進(jìn)行了總結(jié)回顧,強(qiáng)化讀者的實(shí)操水平。本書(shū)案例豐富,注重實(shí)戰(zhàn),既適合 Python 程序員和爬蟲(chóng)愛(ài)好者閱讀學(xué)習(xí),也適合作為廣大職業(yè)院校相關(guān)專(zhuān)業(yè)的教學(xué)用書(shū)。

作者簡(jiǎn)介

  劉延林,知名論壇Python爬蟲(chóng)專(zhuān)題管理員,擅長(zhǎng)Python爬蟲(chóng)技術(shù),并對(duì)Python數(shù)據(jù)分析與挖掘有深入研究。在CSDN等多個(gè)知名博客網(wǎng)站發(fā)表多篇技術(shù)文章,深受讀者的喜愛(ài)。

圖書(shū)目錄

第1篇?快速入門(mén)篇
第1章?Python基礎(chǔ) 2
1.1?Python環(huán)境搭建 3
1.2?Python編程入門(mén) 16
1.3?新手實(shí)訓(xùn) 33
1.4?新手問(wèn)答 35
本章小結(jié) 35
第2章?Python爬蟲(chóng)入門(mén) 36
2.1?爬蟲(chóng)的分類(lèi) 37
2.2?爬蟲(chóng)的基本結(jié)構(gòu)和工作流程 38
2.3?爬蟲(chóng)策略 39
2.4?HTTP的基本原理 40
2.5?網(wǎng)頁(yè)基礎(chǔ) 45
2.6?Session和Cookie 49
2.7?新手實(shí)訓(xùn) 51
2.8?新手問(wèn)答 54
本章小結(jié) 55
第3章?基本庫(kù)的使用 56
3.1?urllib 57
3.2?requests 64
3.3?re正則使用 69
3.4?XPath 75
3.5?新手實(shí)訓(xùn) 78
3.6?新手問(wèn)答 81
本章小結(jié) 82
第4章?Ajax數(shù)據(jù)抓取 83
4.1?Ajax簡(jiǎn)介 84
4.2?使用Python模擬Ajax請(qǐng)求數(shù)據(jù) 91
4.3?新手實(shí)訓(xùn) 93
4.4?新手問(wèn)答 96
本章小結(jié) 96
第5章?動(dòng)態(tài)渲染頁(yè)面爬取 97
5.1?Selenium的使用 98
5.2?Splash的基本使用 115
5.3?新手實(shí)訓(xùn) 127
5.4?新手問(wèn)答 131
本章小結(jié) 132
第6章?代理的設(shè)置與使用 133
6.1?代理設(shè)置 134
6.2?代理池構(gòu)建 136
6.3?付費(fèi)代理的使用 140
6.4?ADSL撥號(hào)代理的搭建 145
6.5?新手問(wèn)答 155
本章小結(jié) 156
第7章?驗(yàn)證碼的識(shí)別與破解 157
7.1?普通圖形驗(yàn)證碼的識(shí)別 158
7.2?極驗(yàn)滑動(dòng)驗(yàn)證碼的破解 164
7.3?極驗(yàn)滑動(dòng)拼圖驗(yàn)證碼破解 168
7.4?新手問(wèn)答 174
本章小結(jié) 175
第8章?App數(shù)據(jù)抓取 176
8.1?Fiddler的基本使用 177
8.2?Charles的基本使用 182
8.3?Appium的基本使用 196
8.4?新手問(wèn)答 217
本章小結(jié) 217
第9章?數(shù)據(jù)存儲(chǔ) 218
9.1?文件存儲(chǔ) 219
9.2?數(shù)據(jù)庫(kù)存儲(chǔ) 224
9.3?新手實(shí)訓(xùn) 236
9.4?新手問(wèn)答 239
本章小結(jié) 240

第2篇?技能進(jìn)階篇
第10章?常用爬蟲(chóng)框架 242
10.1?PySpider框架 243
10.2?Scrapy框架 252
10.3?Scrapy-Splash的使用 262
10.4?新手實(shí)訓(xùn) 266
10.5?新手問(wèn)答 269
本章小結(jié) 269
第11章?部署爬蟲(chóng) 270
11.1?Linux系統(tǒng)下安裝Python 3 271
11.2?Docker的使用 273
11.3?Docker安裝Python 274
11.4?Docker安裝MySQL 277
本章小結(jié) 278

第12章?數(shù)據(jù)分析 279
12.1?NumPy的使用 280
12.2?Pandas的使用 296
12.3?pyecharts的使用 311
12.4?新手實(shí)訓(xùn) 315
12.5?新手問(wèn)答 316
本章小結(jié) 316

第3篇?項(xiàng)目實(shí)戰(zhàn)篇
第13章?爬蟲(chóng)項(xiàng)目實(shí)戰(zhàn) 318
13.1?實(shí)戰(zhàn)一:Selenium+XPath爬取簡(jiǎn)書(shū) 319
13.2?實(shí)戰(zhàn)二:使用requests爬取騰訊人口遷徙數(shù)據(jù) 326
13.3?實(shí)戰(zhàn)三:Scrapy爬取豆瓣電影 330
13.4?實(shí)戰(zhàn)四:使用Selenium多線(xiàn)程異步爬取同城旅游網(wǎng)機(jī)票價(jià)格信息 334
13.5?實(shí)戰(zhàn)五:數(shù)據(jù)分析Dessert Apples下12種蘋(píng)果全年最高、最低和平均銷(xiāo)量 343
13.6?實(shí)戰(zhàn)六:中國(guó)南方航空機(jī)票信息爬取 346
本章小結(jié) 352

附錄?Python常見(jiàn)面試題精選 353

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)