摘要:我們的目標(biāo)是用爬蟲來干一件略污事情最近聽說煎蛋上有好多可愛的妹子,而且爬蟲從妹子圖抓起練手最好,畢竟動力大嘛。服務(wù)器超載尤其是對給定服務(wù)器的訪問過高時。個人爬蟲,如果過多的人使用,可能導(dǎo)致網(wǎng)絡(luò)或者服務(wù)器阻塞。
我們的目標(biāo)是用爬蟲來干一件略污事情
最近聽說煎蛋上有好多可愛的妹子,而且爬蟲從妹子圖抓起練手最好,畢竟動力大嘛。而且現(xiàn)在網(wǎng)絡(luò)上的妹子很黃很暴力,一下接受太多容易營養(yǎng)不量,但是本著有人身體就比較好的套路,特意分享下用點簡單的技術(shù)去獲取資源。
以后如果有機會,再給大家說說日本愛情動(大)作(霧)片的種子搜索爬取,多多關(guān)注。
我們只準(zhǔn)備最簡單的
python 2.7.11
Google Chrome
安裝的時候記得把pip帶上,這樣可以方便我們安裝一些好用的包,來方便我們干壞事(學(xué)習(xí))的過程。
需要用到的包
包括更佳符合人類的HTTP庫--requests
用來解析html文件,快速提取我們需要的內(nèi)容--beautifulsoup4
也可以用下面的命令快速安裝
pip install requests
pip install beautifulsoup4
每天在互聯(lián)網(wǎng)上沖來沖去,瀏覽著大量的信息,觀看這各種鼻血噴發(fā)的圖片,于是作為新時代青年的我們,怎么能忍受被這些大量的垃圾信息充斥的互聯(lián)網(wǎng),我們要反抗,我們要下載!
請,看,下,圖
↓
當(dāng)你在網(wǎng)上沖浪的時候遇到這樣的圖片,我就問你:
虐不虐?虐死了!
下不下?下!
首先,我們需要定位我們需要的圖片
(點開大圖很清晰)
根據(jù)我們之前的準(zhǔn)備的作案工具,使用chrome來訪問網(wǎng)頁
http://jandan.net/ooxx
然后打開開發(fā)者工具菜單 -> 更多工具 -> 開發(fā)者工具
看下圖右邊的神器
(圖都不點開還學(xué)個毛線)
點擊這個圖標(biāo)會出現(xiàn)塊選擇器,
鼠標(biāo)移動我們感興趣的部分
(點開大圖,你就看得見點哪里了)
按照圖片指示點擊區(qū)域
(點開大圖……我都懶得復(fù)述了)
右邊神器中就會出現(xiàn)我們所需要的img標(biāo)簽
(開,大,圖??瓶疲?/p>
查看之前最后一個以#comments開頭的標(biāo)簽,
它包含了所有img的子標(biāo)簽。
打開cmd或者終端
輸入python
輸入以下神秘代碼
現(xiàn)在偷偷看一下你的當(dāng)前目錄
是不是有很多(污)的圖片
網(wǎng)絡(luò)爬蟲(又被稱為網(wǎng)頁蜘蛛,網(wǎng)絡(luò)機器人,在FOAF社區(qū)中間,更經(jīng)常的稱為網(wǎng)頁追逐者),是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。
爬蟲的使用對很多工作都是很有用的,但是對一般的社區(qū),也需要付出代價。使用爬蟲的代價包括:
網(wǎng)絡(luò)資源:在很長一段時間,爬蟲使用相當(dāng)?shù)膸捀叨炔⑿械毓ぷ鳌?br>服務(wù)器超載:尤其是對給定服務(wù)器的訪問過高時。
質(zhì)量糟糕的爬蟲,可能導(dǎo)致服務(wù)器或者路由器癱瘓,或者會嘗試下載自己無法處理的頁面。
個人爬蟲,如果過多的人使用,可能導(dǎo)致網(wǎng)絡(luò)或者服務(wù)器阻塞。
是不是還不夠
行蹤不定的下期預(yù)告
看著上面規(guī)整的排版——前后有序、圖文并茂,不就是練手爬蟲技術(shù)最好的機會嗎?今天就到這里了,讀取下一頁什么的就靠你自己探索,我將會在下個系列給你一個參考方法,希望你持續(xù)關(guān)注。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/44517.html
摘要:探探機器人,自動根據(jù)不同妹紙漢子顏值年齡等類型,喜歡忽略,歡迎各位先看一下實現(xiàn)的結(jié)果吧今天要講的主題是使用腳本實現(xiàn)你自己想要自動操控的任意手機。 前言 之前寫了篇文章:【全是干貨】談?wù)勅绾螌W(xué)習(xí)一項新技能,沒有理論,全是實戰(zhàn),里面第五點提到用腳本玩探探,昨天花了一個小時實現(xiàn)了該功能。 Github:探探機器人,自動根據(jù)不同妹紙/漢子顏值、年齡等類型,喜歡、忽略,歡迎各位star 先看一下...
摘要:時間永遠都過得那么快,一晃從年注冊,到現(xiàn)在已經(jīng)過去了年那些被我藏在收藏夾吃灰的文章,已經(jīng)太多了,是時候把他們整理一下了。那是因為收藏夾太亂,橡皮擦給設(shè)置私密了,不收拾不好看呀。 ...
摘要:利用強大的語言制作屬于自己的第一張詞云。還有一件很有意思的事情,和的中文意思,都是蟒蛇。好,接下來進入正題,一步一步實現(xiàn)我們的第一張詞云。但是我們?nèi)绻獙χ形倪M行分析,還必須要借助中文分詞技術(shù)。 相信很多人在網(wǎng)上,或者是在一些報告或者ppt上,都看到過類似這種圖片 showImg(https://segmentfault.com/img/bVQRr0?w=1920&h=919); 你可...
閱讀 2430·2021-11-24 10:31
閱讀 3487·2021-11-23 09:51
閱讀 2327·2021-11-15 18:11
閱讀 2450·2021-09-02 15:15
閱讀 2516·2019-08-29 17:02
閱讀 2347·2019-08-29 15:04
閱讀 908·2019-08-29 12:27
閱讀 2921·2019-08-28 18:15