注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計實戰(zhàn)Python網(wǎng)絡爬蟲

實戰(zhàn)Python網(wǎng)絡爬蟲

實戰(zhàn)Python網(wǎng)絡爬蟲

定 價:¥99.00

作 者: 黃永祥 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302524892 出版時間: 2019-05-01 包裝: 平裝
開本: 16 頁數(shù): 468 字數(shù):  

內(nèi)容簡介

  本書從原理到實踐,循序漸進地講述了使用Python開發(fā)網(wǎng)絡爬蟲的核心技術。全書從邏輯上可分為基礎篇、實戰(zhàn)篇和爬蟲框架篇三部分。基礎篇主要介紹了編寫網(wǎng)絡爬蟲所需的基礎知識,包括網(wǎng)站分析、數(shù)據(jù)抓取、數(shù)據(jù)清洗和數(shù)據(jù)入庫。網(wǎng)站分析講述如何使用Chrome和Fiddler抓包工具對網(wǎng)站做全面分析;數(shù)據(jù)抓取介紹了Python爬蟲模塊Urllib和Requests的基礎知識;數(shù)據(jù)清洗主要介紹字符串操作、正則和BeautifulSoup的使用;數(shù)據(jù)入庫講述了MySQL和MongoDB的操作,通過ORM框架SQLAlchemy實現(xiàn)數(shù)據(jù)持久化,進行企業(yè)級開發(fā)。實戰(zhàn)篇深入講解了分布式爬蟲、爬蟲軟件的開發(fā)、12306搶票程序和微博爬取等??蚣芷饕v述流行的爬蟲框架Scrapy,并以Scrapy與Selenium、Splash、Redis結(jié)合的項目案例,讓讀者深層次了解Scrapy的使用。此外,本書還介紹了爬蟲的上線部署、如何自己動手開發(fā)一款爬蟲框架、反爬蟲技術的解決方案等內(nèi)容。 本書使用Python 3.X編寫,技術先進,項目豐富,適合欲從事爬蟲工程師和數(shù)據(jù)分析師崗位的初學者、大學生和研究生使用,也很適合有一些網(wǎng)絡爬蟲編寫經(jīng)驗,但希望更加全面、深入理解Python爬蟲的開發(fā)人員使用。

作者簡介

  黃永祥,CSDN博客專家和簽約講師,多年軟件研發(fā)經(jīng)驗,主要從事機器人流程系統(tǒng)研發(fā)、大數(shù)據(jù)系統(tǒng)研發(fā)、網(wǎng)絡爬蟲研發(fā)以及自動化運維系統(tǒng)研發(fā)。擅長使用Python編寫高質(zhì)量代碼,對Python有深入研究,熱愛分享和新技術的探索。

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號