摘要:標(biāo)簽不區(qū)分大小寫,但推薦小寫。標(biāo)簽可以嵌套,但不能交叉嵌套。標(biāo)簽也稱為元素。比如行內(nèi)標(biāo)簽亦可成行內(nèi)元素。
????????
??直接跳到末尾?? ——>領(lǐng)取專屬粉絲福利?
?????????
??上一篇博文兩萬字博文教你python爬蟲requests庫,看完還不會我把我女朋友都給你【??熬夜整理&建議收藏??】被眾多爬蟲愛好者/想要學(xué)習(xí)爬蟲的小伙伴們閱讀之后,很多小伙伴私信我說——爬是會爬了,但是爬下來的都是網(wǎng)頁源碼數(shù)據(jù),真心看不懂鴨!該怎么辦??
??(苦笑)為了能讓小伙伴們對日后所學(xué)的頁面解析庫理解更深,所以本博主又連夜加班加點,苦苦熬制本文(分上下兩篇哦!),為大家深入全面的講解一下常見的前端知識——學(xué)啥技術(shù)都是從底層抓起,萬丈高樓平地起,它也是基于地基穩(wěn)! 所以本文(共分上下兩篇哦?。┦潜软撁娼馕鰩煲纫徊娇偨Y(jié)給小伙伴們哦!?
??在這兩篇博文中,本博主就帶領(lǐng)小伙伴們認(rèn)真地學(xué)習(xí)一下HTML(超文本標(biāo)記語言)相關(guān)的必備知識(爬蟲爬到數(shù)據(jù)之后解析頁面數(shù)據(jù)你得多少能看懂頁面結(jié)構(gòu)?。?font size="4" color="Blue">HTML是一門標(biāo)記語言,標(biāo)記語言由一套標(biāo)記標(biāo)簽組成,學(xué)習(xí)HTML,就是學(xué)習(xí)標(biāo)簽。!?
??相信有不少小伙伴已經(jīng)通過我的上篇博文完全地學(xué)費了requests庫,而本篇(以及下篇)文講解的HTML知識,將會使你日后解析爬取到的頁面數(shù)據(jù)信手拈來哦~
知識點補給站: |
如果把網(wǎng)頁比作一個人的話,HTML相當(dāng)于骨架,JavaScript相當(dāng)于肌肉,CSS相當(dāng)于皮膚。三者結(jié)合起來才能形成一個完善的網(wǎng)頁。首先要普及的一個概念是一個網(wǎng)頁組成部分: ①HTML:用于定義網(wǎng)頁里面有什么內(nèi)容; ②CSS:對內(nèi)容進(jìn)行排版; (1)找到要排版的內(nèi)容————如何找到要排版的標(biāo)簽; (2)設(shè)置樣式————標(biāo)簽都能設(shè)置哪些樣式。 ③JavaScript:用于動態(tài)的控制頁面。
HTML:(HyperText Markup Language)【超文本標(biāo)記語言】
??狹義的HTML指的是網(wǎng)頁;
??廣義的HTML指的是前端技術(shù)(html,css,js,以及各種框架)——網(wǎng)頁,移動端網(wǎng)頁,小程序,公眾號,移動端的app,快應(yīng)用等。
詳細(xì)介紹:
??HypertText:超文本——超出文本的范疇,簡單地說,不僅僅是文本,還可以是圖像,音頻,視頻,flash等等;
??Markup:標(biāo)記——網(wǎng)頁中會有很多標(biāo)記,不同的標(biāo)記有不同的含義和功能,標(biāo)記也叫標(biāo)簽,Html會包含各種各樣的標(biāo)簽,這些標(biāo)簽不能亂寫,必須寫w3c規(guī)范中包含的標(biāo)簽。
標(biāo)簽的舉例:
??① -- 雙標(biāo)簽
??②
-- 單標(biāo)簽
??HTML是一門標(biāo)記語言,標(biāo)記語言由一套標(biāo)記標(biāo)簽組成,學(xué)習(xí)HTML,就是學(xué)習(xí)標(biāo)簽。
??編輯器:pycharm(搞python的肯定得用pycharm!)
??瀏覽器:Firefox,Chrome(建議使用這倆哦!)
如果你再pycharm里新建一個html文件就會像下面這樣!
<!DOCTYPE html> #文檔類型的聲明"en"> #根標(biāo)簽,即文檔的開始。 lang(language),en(english)。聲明語言類型是英語 #網(wǎng)頁頭部 "UTF-8"> #國際編碼 meta配置 字符集編碼的類型 Title</title> #網(wǎng)頁標(biāo)題</head> #網(wǎng)頁的主體,可視化區(qū)域</body></html>
知識點補給站:
標(biāo)簽:作用:在html文件最前面進(jìn)行聲明,定義文檔類型,告知瀏覽器用html規(guī)范去解析文檔。
在pycharm中編寫HTML文件時, 為注釋,快捷鍵是Ctrl+/。
在pycharm中編寫HTML文件時,打標(biāo)簽時可直接打標(biāo)簽名,再Tab即可實現(xiàn)自動補全。 如:輸入p,再Tab會自動補全為:
由尖括號包裹單詞構(gòu)成,如:<html>,所以標(biāo)簽不可能以數(shù)字開頭。
錯誤示例:</a></b>正確示例:</b></a>
開始標(biāo)簽又稱開放標(biāo)簽標(biāo)簽體結(jié)束標(biāo)簽又稱閉合標(biāo)簽或關(guān)標(biāo)簽
自閉合標(biāo)簽/單標(biāo)簽,如:,
等
單標(biāo)簽有兩種寫法: 寫法一:只寫開標(biāo)簽即可<br> 寫法二:在開標(biāo)簽的結(jié)尾寫一個/,如<br/>
通常為鍵值對形式出現(xiàn),比如: 里面的charset為標(biāo)簽的屬性,對應(yīng)的單引號或者雙引號里的稱為屬性值;
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>塊狀標(biāo)簽的特點</title></head><body> <!--塊狀標(biāo)簽的特點:(通過段落標(biāo)簽p進(jìn)行說明)--> <!--1.設(shè)置寬高有效,以及外邊距和內(nèi)邊距都可控制--> <!--2.在不設(shè)置寬度的情況下,寬度始終與父標(biāo)簽保持一致,與內(nèi)容無關(guān)。是父標(biāo)簽容器的100%;--> <!--3.可以獨占一行,實現(xiàn)自動換行。一個段落標(biāo)簽不管多少內(nèi)容都占一行--> <!--4.當(dāng)多個塊狀標(biāo)簽寫一起時,默認(rèn)排列方式是從上向下--> <!--5.可以容納內(nèi)聯(lián)元素和其他塊元素--> <p style="width:100px; height:100px">這是個段落標(biāo)簽,我是塊狀標(biāo)簽</p></body></html>
知識點補給站: 1.px是像素,是長度單位; 2.在網(wǎng)頁查看元素(ELements)顯示的是寬度*高度。 |
小知識點:網(wǎng)頁的默認(rèn)字號是1em(1em=16px)!
總共有四個:
<h1>我是一級標(biāo)簽,一個網(wǎng)頁只能有一個,別的可以有多個h1> <h2>我是二級標(biāo)簽h2>
<p>我是段落標(biāo)簽p>
<ol type="A" start="3"> <li>這是有序列表1li> <li>這是有序列表2li> <li>這是有序列表3li> ol> <ul type="circle"> <li>這是無序列表1li> <li>這是無序列表2li> <li>這是無序列表3li> <li>這是無序列表4li> ul> <dl> <dt>水果dt> <dd>葡萄dd> <dd>榴蓮dd> <dt>蔬菜dt> <dd>花菜dd> <dd>包菜dd> dl>
<div style="width:500px;height: 500px;background-color: #66a9fe;">我是一個divdiv>
知識點補給站: |
??如果嫌打列表標(biāo)簽太麻煩,可使用快捷方法:(n表示相應(yīng)的標(biāo)簽的個數(shù),直接輸入下面語句Tab一下即可生成?。?br />
*是乘的作用,后面跟一個數(shù)字,數(shù)字是幾,就會生成幾個標(biāo)簽!
舉例:
實現(xiàn):
$可以代表一個數(shù)字,這個數(shù)字從1開始,逐步增大,通常和*連用。
舉例:
實現(xiàn):
{}里面用于書寫標(biāo)簽的文本內(nèi)容。
舉例:
實現(xiàn):
[]里面用于書寫屬性名和屬性值(如果不加屬性值,則創(chuàng)建屬性值為空的屬性)
舉例①:
舉例②:
實現(xiàn)①:
實現(xiàn)②:
>用于指示下一級標(biāo)簽,他們構(gòu)成父子關(guān)系(包含關(guān)系)
舉例:
說明:
+在當(dāng)前標(biāo)簽的后面生成一個平級的標(biāo)簽(兄弟關(guān)系)
舉例:
實現(xiàn):
#a生成一個id位a的div標(biāo)簽
舉例:
實現(xiàn):
綜合使用:
舉例①:
實現(xiàn)①:
舉例②:
實現(xiàn)②:
舉例③:
實現(xiàn)③:
舉例④:
實現(xiàn)④:
舉例⑤:
實現(xiàn)⑤:
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>內(nèi)聯(lián)標(biāo)簽,又稱行內(nèi)標(biāo)簽的特點</title></head><body> <!--內(nèi)聯(lián)標(biāo)簽的特點(通過文本標(biāo)簽span說明)--> <!--1.設(shè)置寬高無效,以及外邊距和內(nèi)邊距都無法控制--> <!--2.寬度就是其文字或者圖片寬度,無法控制--> <!--3.不會進(jìn)行自動換行,只有本行放滿才會放下一行--> <!--4.當(dāng)多個內(nèi)聯(lián)標(biāo)簽寫在一起時,默認(rèn)排列方式是從左往右--> <!--5.內(nèi)聯(lián)元素只能容納文本或者其他內(nèi)聯(lián)元素--> <span>我是個文本標(biāo)簽</span></body></html>
總共有四種:
<img src="" alt="" width="" height="">
<b>我是粗體b> <i>我是斜體i>
<a href="" title="超鏈接的一個說明(鼠標(biāo)放上會顯示的文本)" target="_self">我是超鏈接a>
<span>我是文本標(biāo)簽span>
知識點補給站第一站點: |
如果圖片標(biāo)簽里填的是本地圖片的地址(相對路徑):
??1.如果圖片在同級目錄下,直接: 當(dāng)前目錄名/圖片名
或者: ./當(dāng)前目錄名/圖片名
??2.如果圖片在上級目錄下,直接: . ./圖片名
知識點補給站第二站點: |
至于為什么要實現(xiàn)行內(nèi)標(biāo)簽和塊狀標(biāo)簽的相互轉(zhuǎn)換,小伙伴們在設(shè)置css樣式時會get到這個點哦。
??比如:塊狀標(biāo)簽是不能放在一行了,但我們可以通過先轉(zhuǎn)換為行內(nèi)標(biāo)簽就可以了!?。?br />
從現(xiàn)在做起,堅持下去,一天進(jìn)步一小點,不久的將來,你會感謝曾經(jīng)努力的你! |
?本博主會持續(xù)更新爬蟲基礎(chǔ)分欄及爬蟲實戰(zhàn)分欄(為了小伙伴們更好的進(jìn)行頁面解析,也會更新部分前端必備知識點博文?。J(rèn)真仔細(xì)看完本文的小伙伴們,可以點贊收藏并評論出你們的讀后感。并可關(guān)注本博主,在今后的日子里閱讀更多爬蟲文!
如有錯誤或者言語不恰當(dāng)?shù)牡胤娇稍谠u論區(qū)指出,謝謝! 如轉(zhuǎn)載此文請聯(lián)系我說明用以意并標(biāo)注出處及本博主名,謝謝!
?
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/122442.html
摘要:今天,一條就帶大家徹底跨過排序算法這道坎,保姆級教程建議收藏。利用遞歸算法,對分治后的子數(shù)組進(jìn)行排序?;舅枷攵雅判蚴抢枚堰@種數(shù)據(jù)結(jié)構(gòu)而設(shè)計的一種排序算法,堆排序是一種選擇排序,它的最壞,最好,平均時間復(fù)雜度均為,它也是不穩(wěn)定排序。 ...
摘要:正式的專欄第篇,同學(xué)站住,別錯過這個從開始的文章前面學(xué)委的入門到精通專欄積累了篇文章,當(dāng)然學(xué)委博客還有幾十篇應(yīng)用的文章。 正式的Python專欄第9篇,同學(xué)站住...
摘要:友情提示先關(guān)注收藏,再查看,萬字保姆級語言從入門到精通教程。及大牛出天地開始有隨之乃有萬種語年英國劍橋大學(xué)推出了語言。 友情提示:先關(guān)注收藏,再查看,13 萬字保...
摘要:大家好,我是冰河有句話叫做投資啥都不如投資自己的回報率高。馬上就十一國慶假期了,給小伙伴們分享下,從小白程序員到大廠高級技術(shù)專家我看過哪些技術(shù)類書籍。 大家好,我是...
摘要:因為是全中文的,對一些英語不好的人來說確實是福利。二下載安裝下載官網(wǎng)下載地址進(jìn)去之后,點擊點擊后就會自動下載了。 文章目錄 推薦系列教程,推薦的一定是精選的!一....
閱讀 2541·2021-11-18 10:02
閱讀 2026·2021-10-13 09:40
閱讀 3066·2021-09-07 10:07
閱讀 2190·2021-09-04 16:48
閱讀 1076·2019-08-30 13:18
閱讀 2511·2019-08-29 14:03
閱讀 2994·2019-08-29 12:54
閱讀 3215·2019-08-26 11:41