注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)程序設(shè)計(jì)綜合Python爬蟲從菜鳥到高手

Python爬蟲從菜鳥到高手

Python爬蟲從菜鳥到高手

定 價(jià):¥119.00

作 者: 李寧
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787302640516 出版時(shí)間: 2023-09-01 包裝: 平裝
開本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書從實(shí)戰(zhàn)角度系統(tǒng)論述了Python 爬蟲技術(shù)的核心知識(shí),并通過大量的真實(shí)項(xiàng)目幫助讀者深入掌握Python 爬蟲技術(shù)及其實(shí)現(xiàn)。本書提供了大量實(shí)戰(zhàn)案例,演繹采用各種技術(shù)編寫Python 爬蟲的方式。讀者可以任意組合使用這些技術(shù),完成非常復(fù)雜的爬蟲應(yīng)用。本書共20 章,分為五篇。第一篇:基礎(chǔ)知識(shí)(第1~2 章),主要包括Python 編程環(huán)境的搭建、IDE 的安裝和使用、HTTP 的基礎(chǔ)知識(shí)、網(wǎng)頁(yè)基礎(chǔ)(HTML、CSS、JavaScript)、爬蟲的基本原理、Session、Cookie。第二篇:網(wǎng)絡(luò)庫(kù)(第3~5 章),主要包括網(wǎng)絡(luò)庫(kù)urllib、urllib3 和requests 的核心使用方法,例如,發(fā)送HTTP 請(qǐng)求、處理超時(shí)、設(shè)置HTTP 請(qǐng)求頭、處理中文字符、搭建和使用代理、解析鏈接、Robots 協(xié)議等。第三篇:解析庫(kù)(第6~9 章),主要包括3 個(gè)常用解析庫(kù)(lxml、Beautiful Soup 和pyquery)的使用方法,同時(shí)介紹了多種用于分析HTML 代碼的技術(shù),例如,正則表達(dá)式、XPath、CSS 選擇器、方法選擇器等。第四篇:數(shù)據(jù)存儲(chǔ)(第10~11 章),主要包括Python 中數(shù)據(jù)存儲(chǔ)的解決方案,如文件存儲(chǔ)和SQLite 數(shù)據(jù)庫(kù)。第五篇:爬蟲高級(jí)應(yīng)用(第12~20 章),主要包括Python 爬蟲的一些高級(jí)技術(shù),如抓取異步數(shù)據(jù)、Selenium、Splash、抓取移動(dòng)App 數(shù)據(jù)、Appium、多線程爬蟲、爬蟲框架Scrapy、通過OpenCV 技術(shù)識(shí)別驗(yàn)證碼;最后給出一個(gè)綜合的實(shí)戰(zhàn)案例,該案例綜合了Python 爬蟲、數(shù)據(jù)存儲(chǔ)、PyQt、多線程、數(shù)據(jù)可視化、Web 等多種技術(shù)實(shí)現(xiàn)一個(gè)可視化爬蟲。

作者簡(jiǎn)介

暫缺《Python爬蟲從菜鳥到高手》作者簡(jiǎn)介

圖書目錄

暫缺《Python爬蟲從菜鳥到高手》目錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)