講講python使用xpath中遇到[<Element a at 0x39a9a80>到

darry 發(fā)布于2019-07-30 15:16 / 1228人閱讀

摘要：在這里我表示所有不經(jīng)驗證的轉(zhuǎn)載都是耍流氓，把一篇篇錯誤的文章轉(zhuǎn)載的到處都是，不知道浪費了多少人的時間精力去反復調(diào)試錯誤的代碼，尤其是對初學者有極大的打擊性。

寫在前面

本人的所有文章只適合善于使用百度的人，因為所有基礎(chǔ)知識個個博客復制粘貼了無數(shù)遍，我這里均不會詳細講述。

在這里我表示所有不經(jīng)驗證的轉(zhuǎn)載都是耍流氓，把一篇篇錯誤的文章轉(zhuǎn)載的到處都是，不知道浪費了多少人的時間精力去反復調(diào)試錯誤的代碼，尤其是對初學者有極大的打擊性。

大家在學習python爬蟲的過程中，會發(fā)現(xiàn)一個問題，語法我看完了，說的也很詳細，我也認真看了，爬蟲還是不會寫，或者沒有思路，所以我的所有文章都會從實例的角度來解析一些常見的問題和報錯。

Element是什么

回歸正題，大家暈頭轉(zhuǎn)腦的看完繁雜的語法之后，已經(jīng)迫不及待寫點什么東西了，然后部分同學可能遇到了這個

或者類似 Element a at 0x???????，這樣的一個值，然后大家?guī)е鴨栴}去搜，然后全是英文啊，什么一大堆亂七八糟的啊，英文不好的同學就崩潰了，在這里，我會重點解析一下

某種意義上來說，當你打印變量的時候得到的這個值，其實它是一個列表，然后列表中的每一個值都是一個字典

如何使用理解請看半成品開車實例，證明了本人非常擅長把學習和樂趣結(jié)合起來并且切身解決日常需求，滑稽臉.jpg

from bs4 import BeautifulSoup
from lxml import etree
import requests

gjc="SHKD-700"
#定義URL
html = "http://www.btanv.com/search/"+gjc+"-hot-desc-1"
#解碼URL
html = requests.get(html).content.decode("utf-8")
#解析成xml
dom_tree = etree.HTML(html)
#在xml中定位節(jié)點，返回的是一個列表
links = dom_tree.xpath("http://a[@class="download"]")
for index in range(len(links)):
    # links[index]返回的是一個字典
    if (index % 2) == 0:
        print(links[index].tag)
        print(links[index].attrib)
        print(links[index].text)

實例解析

下面重點看看這個代碼，

        print(links[index])
        print(type(links[index]))
        print(links[index].tag)#獲取標簽名a
        print(links[index].attrib)#獲取標簽的屬性href和class
        print(links[index].text)#獲取標簽的文字部分

打印出來的是



a
{"href": "magnet:?xt=urn:btih:7502edea0dfe9c2774f95118db3208a108fe10ca", "class": "download"}
磁力鏈接

該節(jié)點的html代碼為

磁力鏈接

看到這里大家應(yīng)該就非常獸血沸騰的了解了三個屬性的用法了。

總結(jié)

Element類型是"lxml.etree._Element"，某種意義來說同時是一個列表

列表的需要使用tagattrib ext三個不同的屬性來獲取我們需要的東西

變量.tag獲取到的是標簽名是---字符串

變量.attrib獲取到的是節(jié)點標簽a的屬性---字典

變量.text獲取到的是標簽文本--字符串

歡迎收藏點贊，拒絕轉(zhuǎn)載，因為目前我也是自學向前摸索，這些都是我目前認知到的東西，肯定有講的不準確的地方，不希望會誤導到他人

GPU云服務(wù)器云服務(wù)器 asp中&lt&gt的意思 python &lt&gt asp &lt&gt asp &lt= &gt

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://www.ezyhdfw.cn/yun/41149.html

發(fā)表評論

登陸后可評論

0條評論

darry

男|高級講師

我要關(guān)注我要私信

TA的文章

tensorflow是否安裝成功

閱讀 4111·2023-04-26 02:07
SvenHost：黑色星期五，美國VPS，免費DDOS保護，全線優(yōu)惠，最高達40%，月付$4.2起

閱讀 3739·2021-10-27 14:14
InterServer：新增存儲服務(wù)，支持安裝OwnCloud，月付3美元起

閱讀 2964·2021-10-14 09:49
第五第六天

閱讀 1684·2019-08-30 15:43
年終活動h5動畫總結(jié)

閱讀 2694·2019-08-29 18:33
css3實現(xiàn)顫動的動畫

閱讀 2430·2019-08-29 17:01
淺談前端優(yōu)化的幾個思路

閱讀 974·2019-08-29 15:11
margin詳解

閱讀 675·2019-08-29 11:06

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

講講python使用xpath中遇到[<Element a at 0x39a9a80>到

相關(guān)文章

Python通用驗證碼識別OCR庫ffffddocr的安裝使用教程

**怎么使用python對圖片進行批量壓縮**

Python+Selenium實現(xiàn)在Geoserver批量發(fā)布Mongo矢量數(shù)據(jù)

Python xpath,JsonPath,bs4的基本使用方法

發(fā)表評論

0條評論

darry

男|高級講師

TA的文章

tensorflow是否安裝成功

SvenHost：黑色星期五，美國VPS，免費DDOS保護，全線優(yōu)惠，最高達40%，月付$4.2起

InterServer：新增存儲服務(wù)，支持安裝OwnCloud，月付3美元起

第五第六天

年終活動h5動畫總結(jié)

css3實現(xiàn)顫動的動畫

淺談前端優(yōu)化的幾個思路

margin詳解

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

講講python使用xpath中遇到[<Element a at 0x39a9a80>到

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！