亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

講講python使用xpath中遇到[<Element a at 0x39a9a80>到

darry / 1228人閱讀

摘要:在這里我表示所有不經(jīng)驗證的轉(zhuǎn)載都是耍流氓,把一篇篇錯誤的文章轉(zhuǎn)載的到處都是,不知道浪費了多少人的時間精力去反復調(diào)試錯誤的代碼,尤其是對初學者有極大的打擊性。

寫在前面

本人的所有文章只適合善于使用百度的人,因為所有基礎(chǔ)知識個個博客復制粘貼了無數(shù)遍,我這里均不會詳細講述。

在這里我表示所有不經(jīng)驗證的轉(zhuǎn)載都是耍流氓,把一篇篇錯誤的文章轉(zhuǎn)載的到處都是,不知道浪費了多少人的時間精力去反復調(diào)試錯誤的代碼,尤其是對初學者有極大的打擊性。

大家在學習python爬蟲的過程中,會發(fā)現(xiàn)一個問題,語法我看完了,說的也很詳細,我也認真看了,爬蟲還是不會寫,或者沒有思路,所以我的所有文章都會從實例的角度來解析一些常見的問題和報錯。


Element是什么

回歸正題,大家暈頭轉(zhuǎn)腦的看完繁雜的語法之后,已經(jīng)迫不及待寫點什么東西了,然后部分同學可能遇到了這個


或者類似 Element a at 0x???????,這樣的一個值,然后大家?guī)е鴨栴}去搜,然后全是英文啊,什么一大堆亂七八糟的啊,英文不好的同學就崩潰了,在這里,我會重點解析一下

某種意義上來說,當你打印變量的時候得到的這個值,其實它是一個列表,然后列表中的每一個值都是一個字典

如何使用理解請看半成品開車實例,證明了本人非常擅長把學習和樂趣結(jié)合起來并且切身解決日常需求,滑稽臉.jpg

from bs4 import BeautifulSoup
from lxml import etree
import requests

gjc="SHKD-700"
#定義URL
html = "http://www.btanv.com/search/"+gjc+"-hot-desc-1"
#解碼URL
html = requests.get(html).content.decode("utf-8")
#解析成xml
dom_tree = etree.HTML(html)
#在xml中定位節(jié)點,返回的是一個列表
links = dom_tree.xpath("http://a[@class="download"]")
for index in range(len(links)):
    # links[index]返回的是一個字典
    if (index % 2) == 0:
        print(links[index].tag)
        print(links[index].attrib)
        print(links[index].text)
        
實例解析

下面重點看看這個代碼,

        print(links[index])
        print(type(links[index]))
        print(links[index].tag)#獲取標簽名a
        print(links[index].attrib)#獲取標簽的屬性href和class
        print(links[index].text)#獲取標簽的文字部分

打印出來的是



a
{"href": "magnet:?xt=urn:btih:7502edea0dfe9c2774f95118db3208a108fe10ca", "class": "download"}
磁力鏈接

該節(jié)點的html代碼為

磁力鏈接

看到這里大家應(yīng)該就非常獸血沸騰的了解了三個屬性的用法了。

總結(jié)

Element類型是"lxml.etree._Element",某種意義來說同時是一個列表

列表的需要使用tagattrib ext三個不同的屬性來獲取我們需要的東西

變量.tag獲取到的是標簽名是---字符串

變量.attrib獲取到的是節(jié)點標簽a的屬性---字典

變量.text獲取到的是標簽文本--字符串

歡迎收藏點贊,拒絕轉(zhuǎn)載,因為目前我也是自學向前摸索,這些都是我目前認知到的東西,肯定有講的不準確的地方,不希望會誤導到他人

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/41149.html

相關(guān)文章

  • Python通用驗證碼識別OCR庫ffffddocr的安裝使用教程

      小編寫這篇文章的主要目的,主要是給大家去做一個相關(guān)的介紹,介紹的內(nèi)容是關(guān)于Python通用驗證碼的一些相關(guān)小技巧,包括有通用驗證碼識別相關(guān)的OCR庫,同時也會給大家介紹一些內(nèi)容,介紹包括OCR庫ddddocr安裝使用教程,下面小編就給大家詳細解答下。  前言  在使用自動化登錄網(wǎng)站的時候,經(jīng)常輸入用戶名和密碼后會遇到驗證碼。今天介紹一款通用驗證碼識別OCR庫,對驗證碼識別徹底說拜拜,它的名字是...

    89542767 評論0 收藏0
  • 怎么使用python對圖片進行批量壓縮

      小編寫這篇文章的主要目的,主要是講解一些關(guān)于python的事情,比如需要對圖片進行批量壓縮,壓縮的方法還是比較的多的,那么,為了提高效率,怎么進行批量壓縮呢?下面就給大家詳細解答下?! ∏把浴 ∽罱谘芯吭趺磳D片資源進行無損壓縮,網(wǎng)上也找了一些資料??偠灾斋@不少,所以想對最近的學習做個總結(jié)?! o損壓縮其實是相對而言的,目的是為了減小圖片資源的內(nèi)存大小但又不影響圖片的顯示質(zhì)量。下面我將...

    89542767 評論0 收藏0
  • Python+Selenium實現(xiàn)在Geoserver批量發(fā)布Mongo矢量數(shù)據(jù)

      小編寫這篇文章的一個主要目的,主要是來給大家做一個解答,解答的內(nèi)容是Python+Selenium,具體的一個內(nèi)容解釋是什么呢?比如,我們可以實現(xiàn)Geoserver批量發(fā)布Mongo矢量數(shù)據(jù),具體的一個內(nèi)容,下面就給大家詳細解答下?! ∈紫?,聲明一下,這里我完成的腳步屬于半自動化的,我戲稱它為有監(jiān)督的半自動化腳本。具體原因后面會詳細說明?! ∫?、安裝Selenium和ChromeDriver ...

    89542767 評論0 收藏0
  • Python xpath,JsonPath,bs4的基本使用方法

      小編寫這篇文章的一個主要目的,主要是來給大家去做一個介紹,介紹的內(nèi)容主要是關(guān)于Python的一些知識,其中的內(nèi)容包含有xpath,JsonPath,bs4等一些知識,主要是去介紹他們的一些基本使用方法,具體的內(nèi)容,下面就給大家詳細解答下?! ?.xpath  1.1 xpath使用  google提前安裝xpath插件,按ctrl+shift+x出現(xiàn)小黑框  安裝lxml庫pip instal...

    89542767 評論0 收藏0

發(fā)表評論

0條評論

darry

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<