注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)工業(yè)技術(shù)建筑科學(xué)建筑設(shè)計(jì)Python網(wǎng)絡(luò)爬蟲技術(shù)與實(shí)戰(zhàn)

Python網(wǎng)絡(luò)爬蟲技術(shù)與實(shí)戰(zhàn)

Python網(wǎng)絡(luò)爬蟲技術(shù)與實(shí)戰(zhàn)

定 價(jià):¥89.00

作 者: 趙國(guó)生,王健 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111674115 出版時(shí)間: 2021-01-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 458 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書是一本系統(tǒng)、全面地介紹Python網(wǎng)絡(luò)爬蟲的實(shí)戰(zhàn)寶典。作者融合自己豐富的工程實(shí)踐經(jīng)驗(yàn),緊密結(jié)合演示應(yīng)用案例,內(nèi)容覆蓋了幾乎所有網(wǎng)絡(luò)爬蟲涉及的核心技術(shù)。在內(nèi)容編排上,一步步地剖析算法背后的概念與原理,提供大量簡(jiǎn)潔的代碼實(shí)現(xiàn),助你從零基礎(chǔ)開(kāi)始編程實(shí)現(xiàn)深度學(xué)習(xí)算法。全書按照學(xué)習(xí)爬蟲所涉及的核心技術(shù)從易到難,再到應(yīng)用的順序分為14章。第1章介紹Python的安裝配置和基礎(chǔ)語(yǔ)法。 第2章介紹爬蟲類型、抓取策略以及網(wǎng)絡(luò)基礎(chǔ)知識(shí)。第3章介紹Python常用庫(kù)。第4章介紹正則表達(dá)式的語(yǔ)法、匹配規(guī)則。第5章講解PIL庫(kù)、Tesseract庫(kù)和TensorFlow庫(kù)的語(yǔ)法、類型和識(shí)別方法。第6章介紹抓包利器Fiddler。第7章介紹數(shù)據(jù)存儲(chǔ)。第8章介紹Scrapy爬蟲框架。第9章介紹多線程爬蟲。第10章介紹動(dòng)態(tài)網(wǎng)頁(yè)爬蟲。第11章介紹分布式爬蟲。第12章介紹電商網(wǎng)站商品信息爬蟲項(xiàng)目。第13章介紹生活?yuàn)蕵?lè)點(diǎn)評(píng)類信息爬蟲。第14章介紹圖片信息類爬蟲項(xiàng)目。

作者簡(jiǎn)介

  趙國(guó)生,哈爾濱師范大學(xué)教授,工學(xué)博士,碩士生導(dǎo)師,黑龍江省網(wǎng)絡(luò)安全技術(shù)領(lǐng)域特殊人才。主要從事可信網(wǎng)絡(luò)、入侵容忍、認(rèn)知計(jì)算、物聯(lián)網(wǎng)安全等方向的教學(xué)與科研工作。擔(dān)任中國(guó)計(jì)算機(jī)學(xué)會(huì)容錯(cuò)專委會(huì)委員、黑龍江省計(jì)算機(jī)學(xué)會(huì)網(wǎng)絡(luò)專委會(huì)委員、中國(guó)青年博士論壇網(wǎng)絡(luò)專委會(huì)委員、國(guó)家自然科學(xué)基金委項(xiàng)目評(píng)審專家、黑龍江省國(guó)資采購(gòu)專家組成員、黑龍江省財(cái)政廳及黑龍江省高等法院信息化資訊專家、黑龍江省教育廳行業(yè)信息系統(tǒng)安全專題培訓(xùn)講師、中國(guó)計(jì)算機(jī)學(xué)會(huì)高級(jí)會(huì)員、中國(guó)計(jì)算機(jī)學(xué)會(huì)YOCSEF哈爾濱副主席。榮獲哈爾濱師范大學(xué)“先進(jìn)工作者”“五四青年獎(jiǎng)?wù)隆薄皩廄R堃”教學(xué)名師等榮譽(yù)。主持國(guó)家自然科學(xué)基金、黑龍江省自然科學(xué)基金、黑龍江省科技廳科技攻關(guān)等項(xiàng)目10項(xiàng),發(fā)表SCI/EI檢索論文50余篇,發(fā)明專利2項(xiàng)、實(shí)用新型專利6項(xiàng),擁有軟件著作權(quán)6項(xiàng),獲省/部級(jí)科技進(jìn)步一等獎(jiǎng)2項(xiàng)、三等獎(jiǎng)1項(xiàng),撰寫《Linux操作系統(tǒng)原理與應(yīng)用》《Matlab數(shù)學(xué)建模與仿真》《Matlab完全學(xué)習(xí)手冊(cè)》《精通Labivew》等編著6部。目前擔(dān)任《電子學(xué)報(bào)》《通信學(xué)報(bào)》《系統(tǒng)仿真學(xué)報(bào)》等期刊審稿專家。

圖書目錄

前言
第1章 Python環(huán)境搭建及基礎(chǔ)學(xué)習(xí)
1.1 Python 3.6的安裝與配置
1.1.1 Windows下的安裝
1.1.2 Linux下的安裝
1.1.3 macOS下的安裝
1.2 IDE工具:PyCharm的安裝
1.3 基礎(chǔ)語(yǔ)法
1.3.1 第一個(gè)Python程序
1.3.2 Python命名規(guī)范
1.3.3 行和縮進(jìn)
1.3.4 注釋和續(xù)行
1.3.5 Python輸出
1.4 字符串
1.4.1 字符串運(yùn)算符
1.4.2 字符串內(nèi)置函數(shù)
1.5 數(shù)據(jù)結(jié)構(gòu)
1.5.1 列表
1.5.2 元組
1.5.3 集合
1.5.4 字典
1.6 控制語(yǔ)句
1.6.1 條件表達(dá)式
1.6.2 選擇結(jié)構(gòu)
1.6.3 循環(huán)結(jié)構(gòu)
1.7 函數(shù)、模塊和包
1.7.1 函數(shù)
1.7.2 模塊
1.7.3 包
1.8 文件的讀寫操作
1.8.1 文件讀寫步驟與打開(kāi)模式
1.8.2 文件的基本操作
1.8.3 文件寫入操作
1.9 面向?qū)ο?br />1.9.1 類和對(duì)象
1.9.2 封裝性
1.9.3 繼承性
1.9.4 多態(tài)性
1.10 本章小結(jié)
練習(xí)題
第2章 爬蟲原理和網(wǎng)絡(luò)基礎(chǔ)
2.2 爬蟲的意義
2.3 爬蟲的原理
2.4 爬蟲技術(shù)的類型
2.4.1 聚焦爬蟲技術(shù)
2.4.2 通用爬蟲技術(shù)
2.4.3 增量爬蟲技術(shù)
2.4.4 深層網(wǎng)絡(luò)爬蟲技術(shù)
2.5 爬蟲抓取策略
2.5.1 深度優(yōu)先遍歷策略
2.5.2 廣度優(yōu)先遍歷策略
2.5.3 PartialPageRank策略
2.5.4 大站優(yōu)先策略
2.5.5 反向鏈接數(shù)策略
2.5.6 0PIC策略
2.6 反爬蟲和反反爬蟲
2.6.1 反爬蟲
2.6.2 反反爬蟲
2.7 網(wǎng)絡(luò)基礎(chǔ)
2.7.1 網(wǎng)絡(luò)體系結(jié)構(gòu)
2.7.2 網(wǎng)絡(luò)協(xié)議
2.7.3 Socket編程
2.8 本章小結(jié)
練習(xí)題
第3章 Python常用庫(kù)
3.1 Python庫(kù)的介紹
3.1.1 常用標(biāo)準(zhǔn)庫(kù)
3.1.2 安裝使用第三方庫(kù)
3.2 urllib庫(kù)
3.2.1 urlopen()函數(shù)用法
3.2.2 urlretrieve()函數(shù)用法
3.2.3 URL編碼和URL解碼
3.2.4 urlparse0和urlsplit()數(shù)用法
3.3 request庫(kù)
3.3.1 request庫(kù)的基本使用
3.3.2 request庫(kù)的高級(jí)用法
3.4 lxml庫(kù)
3.4.1 lxml庫(kù)的安裝和使用
3.4.2 XPath介紹
3.4.3 XPath語(yǔ)法
3.4.4 lxml和XPath的結(jié)合使用
3.5 BeautifuISoup庫(kù)
3.5.1 Beautiful Soup庫(kù)的安裝和使用
3.5.2 提取數(shù)據(jù)
3.5.3 CSS選擇器
3.6 實(shí)戰(zhàn)案例
3.6.1 使用Beautiful Soup解析網(wǎng)頁(yè)
3.6.2 微信公眾號(hào)爬蟲
3.6.3 爬取豆瓣讀書TOP500
3.6.4 使用urllib庫(kù)爬取百度貼吧
3.7 本章小結(jié)
練習(xí)題
……
第4章 正則表達(dá)式
第5章 驗(yàn)證碼
第6章 抓包利器Fiddler
第7章 數(shù)據(jù)存儲(chǔ)
第8章 Scrapy爬蟲框架
第9章 多線程爬蟲
第10章 動(dòng)態(tài)網(wǎng)頁(yè)爬蟲
第11章 分布式爬蟲
第12章 電商站商品信息爬蟲項(xiàng)目
第13章 生活?yuàn)蕵?lè)點(diǎn)評(píng)類信息爬蟲項(xiàng)目
第14章 圖片信息類爬蟲項(xiàng)目
練習(xí)題答案

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)