摘要:我又回頭看那個(gè)爬京東的程序哦我好像被反爬蟲發(fā)現(xiàn)了解決反爬蟲問題這下可以了吧直接點(diǎn)開鏈接看一下沒錯(cuò),火狐才是我的默認(rèn)瀏覽器終于不用再說交封不殺了。
昨晚終于提交了該死的31條CPU,今天十節(jié)課翹了八節(jié),躺在宿舍睡覺,不幸遇到幾百年難得一見的點(diǎn)名……然而當(dāng)時(shí)我在吃炸雞,沒法(懶)趕過去,達(dá)成“第一次翹課就點(diǎn)名”。
心情郁結(jié)的我打算看一看漂亮小姐姐開心一下,于是我發(fā)現(xiàn)了這個(gè)視頻:
據(jù)說是Rose韓國(guó)站的站姐飛去美國(guó)科切拉音樂節(jié)現(xiàn)場(chǎng)拍攝的視頻。因?yàn)樗膫€(gè)站只有Rose的站姐去了,所以視頻、高清圖都非常珍稀。
于是我對(duì)up主說:
交封不殺!
但是顯然up主并不care我的留言,氣。
求人不如求己,打開開發(fā)者工具:
……我瞎了……
老年人還是要放大字體啊。
看我找到了什么?
哈哈哈哈哈哈哈哈哈
復(fù)制鏈接打開:
555為什么會(huì)有這么漂亮的小姐姐?。∥覑哿耍?!
但是后面我又發(fā)現(xiàn)了更多想要封面的視頻:
一個(gè)一個(gè)找我怕不是要累死……
想到“一個(gè)木函”這個(gè)app之前有獲取B站封面的功能,但是后來用不了了。
那我就自己寫一個(gè)!
(非常激動(dòng),畢竟我只會(huì)用python寫hello world)
工具:pycharm(不得不說這東西的logo真丑);
功能:輸入av號(hào),生成封面圖片鏈接;
環(huán)境:python3.7
思路:輸入av號(hào),到相應(yīng)的網(wǎng)址,打開開發(fā)者界面,找到并返回圖片鏈接。
那就開始吧!
剛剛那個(gè)視頻的鏈接是:
結(jié)構(gòu)是https://www.bilibili.com/ + video + av號(hào)。
that"s easy.
def getcover(): avnum=input("please input the av number of your video:") url="https://www.bilibili.com/video/av"+avnum
emmmm,下面該怎么做?
哦對(duì)!下面找圖片的鏈接!
可以看出來,只要找到
itemprop="image"
content="https://balabala.jpg"
就能確定圖片地址。
index1=text.find("itemprop="image"")+len("itemprop="image" content="") index2=text.find(""",index1) cover=text[index1:index2] print(cover)
作為一個(gè)不會(huì)python的人,我能寫出這段真是感天動(dòng)地了。
(我在網(wǎng)上找到好多教python爬蟲的文章,可是他們寫的都好長(zhǎng)好復(fù)雜……然后看到一個(gè)爬取京東商品信息的,從里面摳出來這一段……)
anyway,運(yùn)行!
咦,出錯(cuò)了。
我又回頭看那個(gè)爬京東的程序……
哦!我沒加head。
headers={ "Host":"www.bilibili.com", "User-Agent": "Chrome/73.0.3683.103" }
再運(yùn)行……
還是錯(cuò)。wtf。
我又回頭看那個(gè)爬京東的程序……
哦!我好像被反爬蟲發(fā)現(xiàn)了!
text=requests.get(url,headers=headers).text#解決反爬蟲問題
這下可以了吧?
直接點(diǎn)開鏈接看一下?
沒錯(cuò),火狐才是我的默認(rèn)瀏覽器
perfect!
終于不用再說“交封不殺”了。
下面附上源代碼:
import re import requests def getcover(): avnum=input("please input the av number of your video:") url="https://www.bilibili.com/video/av"+avnum headers={ "Host":"www.bilibili.com", "User-Agent": "Chrome/73.0.3683.103" } text=requests.get(url,headers=headers).text#解決反爬蟲問題 index1=text.find("itemprop="image"")+len("itemprop="image" content="") index2=text.find(""",index1) cover=text[index1:index2] print(cover) getcover()
最后,記錄一下一些“意想不到的bug”。
正常的不會(huì)python的人的bug:
ModuleNotFoundError: No module named "requests"
上網(wǎng)找這個(gè)bug的原因,都顯示因?yàn)闆]有安裝這個(gè)package。
ok,那裝。
順便升級(jí)了一下pip
但是還是同樣的報(bào)錯(cuò)。
找啊找找啊找,終于看到有人說,或許是因?yàn)椤皼]有安裝到同一目錄”。
what???誰(shuí)和誰(shuí)沒有安裝到同一目錄???
但是!我突然想到,第一次用的時(shí)候輸入任何代碼都報(bào)錯(cuò),因?yàn)槲覜]把python放到interpreter里。
打開project interpreter,發(fā)現(xiàn)果然沒有requests。
那就手動(dòng)install一下:
perfect!
不正常的bug:
python語(yǔ)句結(jié)尾不要加分號(hào)!?。?/p>
不要加分號(hào)?。?!
不要加分號(hào)?。?!
python的注釋是#不是// ?。?!
python的注釋是#不是// !??!
python的注釋是#不是// ?。?!
That"s all.
最后,python和C++真的是太不一樣了。
python可以引用的東西非常多,很多東西都不需要自己寫。
但是其實(shí)也差不多,不過相比之下,python的可讀性更好一點(diǎn)。
btw我還是懶得學(xué)orz
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://www.ezyhdfw.cn/yun/43674.html
摘要:摘要近日,阿里云重磅推出視頻點(diǎn)播新功能視頻,基于深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)和海量數(shù)據(jù),為廣大用戶提供多場(chǎng)景的視頻服務(wù)。場(chǎng)景應(yīng)用功能特性阿里云視頻智能服務(wù)在標(biāo)簽預(yù)測(cè)內(nèi)容審核智能封面等層面能夠提供多種應(yīng)用服務(wù)。 摘要: 近日,阿里云重磅推出視頻點(diǎn)播新功能——視頻AI ,基于深度學(xué)習(xí)、計(jì)算機(jī)視覺技術(shù)和海量數(shù)據(jù),為廣大用戶提供多場(chǎng)景的視頻AI服務(wù)。 點(diǎn)此查看原文:http://click.aliy...
閱讀 1528·2021-11-17 09:33
閱讀 3117·2021-10-13 09:39
閱讀 2789·2021-10-09 10:01
閱讀 2529·2021-09-29 09:35
閱讀 4047·2021-09-26 10:01
閱讀 3591·2019-08-26 18:37
閱讀 3240·2019-08-26 13:46
閱讀 1971·2019-08-26 13:39