Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---1、請求庫安裝：Requests、Selenium、ChromeDr

wawor4827 發(fā)布于2019-07-31 10:33 / 1518人閱讀

摘要：下一篇文章網(wǎng)絡(luò)爬蟲實戰(zhàn)請求庫安裝爬蟲可以簡單分為幾步抓取頁面分析頁面存儲數(shù)據(jù)。相關(guān)鏈接官方網(wǎng)站官方文檔中文文檔安裝驗證安裝進入命令行交互模式，導(dǎo)入一下包，如果沒有報錯，則證明安裝成功。

下一篇文章：Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---2、請求庫安裝：GeckoDriver、PhantomJS、Aiohttp

爬蟲可以簡單分為幾步：抓取頁面、分析頁面、存儲數(shù)據(jù)。

在第一步抓取頁面的過程中，我們就需要模擬瀏覽器向服務(wù)器發(fā)出請求，所以需要用到一些 Python 庫來實現(xiàn) HTTP 請求操作，在本書中我們用到的第三方庫有 Requests、Selenium、Aiotttp 等。

在本節(jié)我們介紹一下這些請求庫的安裝方法。

1.1.1 Requests的安裝

由于 Requests 屬于第三方庫，也就是 Python 默認不會自帶這個庫，需要我們手動去安裝，下面我們首先看一下它的安裝過程。

1. 相關(guān)鏈接

GitHub：https://github.com/requests/r...

PyPy：https://pypi.python.org/pypi/...

官方文檔：http://www.python-requests.org

中文文檔：http://docs.python-requests.o...

2. 安裝

pip3 install requests

3. 驗證安裝

為了驗證庫是否已經(jīng)安裝成功，可以在命令行下測試一下：

$ python3
>>> import requests

在命令行首先輸入 python3，進入命令行模式，然后輸入如上內(nèi)容，如果什么錯誤提示也沒有，那么就證明我們已經(jīng)成功安裝了 Requests。

1.1.2 Selenium的安裝

Selenium 是一個自動化測試工具，利用它我們可以驅(qū)動瀏覽器執(zhí)行特定的動作，如點擊、下拉等等操作，對于一些 JavaScript 渲染的頁面來說，此種抓取方式非常有效，下面我們來看下 Selenium 的安裝過程。

1. 相關(guān)鏈接

官方網(wǎng)站：http://www.seleniumhq.org

GitHub：https://github.com/SeleniumHQ...

PyPi：https://pypi.python.org/pypi/...

官方文檔：http://selenium-python.readth...

中文文檔：http://selenium-python-zh.rea...

2. 安裝

pip3 install selenium

3. 驗證安裝

進入 Python 命令行交互模式，導(dǎo)入一下 Selenium 包，如果沒有報錯，則證明安裝成功。

$ python3
>>> import selenium

但這樣還不夠，我們還需要瀏覽器如 Chrome、Firefox 等瀏覽器來配合 Selenium 工作。

下面我們會介紹 Chrome、Firefox、PhantomJS 三種瀏覽器的配置方式，有了瀏覽器我們才可以配合 Selenium 進行頁面的抓取。

1.1.3 ChromeDriver的安裝

在上節(jié)我們成功安裝好了 Selenium 庫，但是它是一個自動化測試工具，需要瀏覽器來配合它使用，那么本節(jié)我們就介紹一下 Chrome 瀏覽器及 ChromeDriver 驅(qū)動的配置。
首先需要下載一個 Chrome 瀏覽器，方法多樣，在此不再贅述。
隨后我們需要安裝一個 ChromeDriver 才能驅(qū)動 Chrome 瀏覽器完成相應(yīng)的操作，下面我們來介紹下怎樣安裝 ChromeDriver。

1. 相關(guān)鏈接

官方網(wǎng)站：https://sites.google.com/a/ch...

下載地址：https://chromedriver.storage....

2. MAC安裝

brew install chromedriver

如果安裝失敗，使用下面方法

brew cask install chromedriver

3. 驗證安裝

配置完成之后，就可以在命令行下直接執(zhí)行 chromedriver 命令了。
命令行下輸入：
chromedriver
輸入控制臺有類似輸出，如圖 1-17 所示：

圖 1-17 控制臺輸出
如果有類似輸出則證明 ChromeDriver 的環(huán)境變量配置好了。
隨后再在程序中測試，執(zhí)行如下 Python 代碼：

from selenium import webdriver
browser = webdriver.Chrome()

運行之后會彈出一個空白的 Chrome 瀏覽器，證明所有的配置都沒有問題，如果沒有彈出，請檢查之前的每一步的配置。
如果彈出之后閃退，則可能是 ChromeDriver 版本和 Chrome 版本不簡容，請更換 ChromeDriver 版本。
如果沒有問題，接下來我們就可以利用 Chrome 來做網(wǎng)頁抓取了。

4. 結(jié)語

既然 Chrome 可以通過 Selenium 驅(qū)動，F(xiàn)irefox 也可以，如果想要實現(xiàn) Selenium 驅(qū)動 Firefox 瀏覽器可以參考下面的 GeckoDriver 的安裝。

GPU云服務(wù)器云服務(wù)器 python3爬蟲實戰(zhàn) python3爬蟲庫 selenium網(wǎng)絡(luò)爬蟲 python3安裝庫

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://www.ezyhdfw.cn/yun/44022.html

發(fā)表評論

登陸后可評論

0條評論

wawor4827

男|高級講師

我要關(guān)注我要私信

TA的文章

tensorflow

閱讀 589·2023-04-26 00:33
Maven項目自動修改JDK版本解決方案 #yyds干貨盤點#

閱讀 3611·2021-11-24 09:39
域名如何綁定自己主機-家用電腦如何綁定域名？

閱讀 3218·2021-09-22 15:34
vue微信網(wǎng)頁授權(quán)最終解決方案

閱讀 2427·2019-08-23 18:07
模擬 vue3.0 rfcs `createComponent` api 中的`props`類型推導(dǎo)

閱讀 2983·2019-08-23 18:04
11 個最好的 JavaScript 動態(tài)效果庫

閱讀 3836·2019-08-23 16:06
《劍指offer》分解讓復(fù)雜問題更簡單

閱讀 2961·2019-08-23 15:27
【劍指offer】1.二維數(shù)組查找

閱讀 1670·2019-08-23 14:32

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---1、請求庫安裝：Requests、Selenium、ChromeDr

相關(guān)文章

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---2、請求庫安裝：GeckoDriver、PhantomJS、Aioh

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---36、分析Ajax爬取今日頭條街拍美圖

**【小白+python+selenium庫+圖片爬取+反爬+資料】超詳細新手實現(xiàn)（01）webdriv**

首次公開，整理12年積累的博客收藏夾，零距離展示《收藏夾吃灰》系列博客

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---17、爬蟲基本原理

發(fā)表評論

0條評論

wawor4827

男|高級講師

TA的文章

tensorflow

Maven項目自動修改JDK版本解決方案 #yyds干貨盤點#

域名如何綁定自己主機-家用電腦如何綁定域名？

vue微信網(wǎng)頁授權(quán)最終解決方案

模擬 vue3.0 rfcs `createComponent` api 中的`props`類型推導(dǎo)

11 個最好的 JavaScript 動態(tài)效果庫

《劍指offer》分解讓復(fù)雜問題更簡單

【劍指offer】1.二維數(shù)組查找

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---1、請求庫安裝：Requests、Selenium、ChromeDr

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---1、請求庫安裝：Requests、Selenium、ChromeDr