從零開(kāi)始寫(xiě)個(gè)編譯器吧 - 文法簡(jiǎn)介

stormzhang 發(fā)布于2019-08-14 12:03 / 1928人閱讀

摘要：而，稱(chēng)之為非終結(jié)符。而這個(gè)展開(kāi)方案中對(duì)各個(gè)非終結(jié)符產(chǎn)生式的選擇過(guò)程，即是對(duì)源代碼中每一個(gè)部分的定性過(guò)程。這個(gè)過(guò)程讓能夠理解源代碼各個(gè)部分表示的含義，并以此生成對(duì)應(yīng)的語(yǔ)法樹(shù)。

我需要定義出 tao 語(yǔ)言的細(xì)節(jié)，在此，需要引出文法這一概念。所謂文法，即是用于描述語(yǔ)言的一種工具。
例如，一個(gè)賦值語(yǔ)句可能寫(xiě)成如下形式：

  variable = 1 + 3

如何充分定義這個(gè)賦值語(yǔ)句的形式呢？若用自然語(yǔ)言描述，我可以說(shuō)，賦值語(yǔ)句最左邊是一個(gè)標(biāo)示符，然后緊接一個(gè)“=”符號(hào)，然后再接一個(gè)表達(dá)式。滿(mǎn)足這個(gè)條件的，即是賦值語(yǔ)句啦。

S → abE

用符號(hào)來(lái)描述的話(huà)，就是如上形式，這種形式稱(chēng)之為 S 的產(chǎn)生式。其中 S 表示賦值語(yǔ)句，a 表示一個(gè)標(biāo)示符，b 是“=”符號(hào)，E 表示表達(dá)式。這里用到了S、a、b、E 四個(gè)不同的字母。

等等，似乎還有什么沒(méi)說(shuō)完，因?yàn)闃?biāo)示符（字母a表示）與“=”符號(hào)（字母b表示）都與 Tokenizer 生成的 Token 對(duì)應(yīng)，但是表達(dá)式（字母E表示）卻沒(méi)有對(duì)應(yīng)的 Token 呀。

于是，我還要進(jìn)一步描述表達(dá)式。這里為了不讓問(wèn)題變得過(guò)于繁瑣，我先假定表達(dá)式只出現(xiàn)加減號(hào)和數(shù)字。那么表達(dá)式的定義如下。

  E → d | E+d | E-d

這里出現(xiàn)的“|”表示“或”，這表明表達(dá)式（字母E）可以展開(kāi)成三種不同的式子。同時(shí)，E 展開(kāi)后的式子中可能再次出現(xiàn) E 本身，這種遞歸形式足以涵蓋任意長(zhǎng)度的表達(dá)式形式。

于是，我們又得到字母 d，d 表示一個(gè)數(shù)字（也與某種 Token 對(duì)應(yīng)）。

至此，我們一共得到了 S、a、b、E、d 五個(gè)不同的字母，其中 a、b、d 都與 Token 對(duì)應(yīng)。然而，雖然 S、E 卻沒(méi)有對(duì)應(yīng)的 Token，但它們都有至少有一個(gè)屬于自己的產(chǎn)生式。

對(duì)于 a、b、d，稱(chēng)之為終結(jié)符。即它們不會(huì)再有自己的產(chǎn)生式了。而 S、E，稱(chēng)之為非終結(jié)符。

當(dāng)我們?yōu)槭阶又心硞€(gè)非終結(jié)符挑選一個(gè)特定的產(chǎn)生式，并用產(chǎn)生式的右邊部分代替這個(gè)非終結(jié)符在式子中的位置，那么我們將這個(gè)過(guò)程稱(chēng)之為非終結(jié)符的展開(kāi)。

考慮下面這行代碼：

  index = 15 + 7 - 3

其形如 abd+d-d（a 為 "index"、b 為"="、d 為"15", "7", "3"）

對(duì)于 S 有如下展開(kāi)方式：

  S → abE
  
  → abE-d（展開(kāi) E → E-d）
  
  → abE+d-d（展開(kāi) E → E+d）
  
  → abd+d-d（展開(kāi) E → d）

其中 S 表示一個(gè)賦值語(yǔ)句。既然 S 存在某種展開(kāi)方式，其形式與這行代碼完全相同，我們說(shuō)，這行代碼與 S 是匹配的。對(duì)于 Parser 而言，即可斷定這行語(yǔ)句是一個(gè)賦值語(yǔ)句。

因此，Parser 讀取語(yǔ)言的文法定義。然后，通過(guò)找到一個(gè)展開(kāi)方案以匹配源代碼。而這個(gè)展開(kāi)方案中對(duì)各個(gè)非終結(jié)符產(chǎn)生式的選擇過(guò)程，即是對(duì)源代碼中每一個(gè)部分的定性過(guò)程。這個(gè)過(guò)程讓 Parser 能夠理解源代碼各個(gè)部分表示的含義，并以此生成對(duì)應(yīng)的語(yǔ)法樹(shù)（Syntax Tree）。

GPU云服務(wù)器云服務(wù)器從零開(kāi)始 linux從零開(kāi)始 python從零開(kāi)始從零開(kāi)始php

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://www.ezyhdfw.cn/yun/64262.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

stormzhang

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

activate

閱讀 3402·2023-04-25 17:19
Linux快速學(xué)習(xí)-vi編輯器常用命令

閱讀 701·2021-11-23 09:51
Pia云雙11活動(dòng)：新用戶(hù)全場(chǎng)5折，可選美國(guó)三網(wǎng)CN2 GIA月付10元起，香港純CN2永不混線(xiàn)月付

閱讀 1410·2021-11-08 13:19
ASEMI肖特基二極管MBR20200FCT參數(shù)詳解

閱讀 857·2021-09-29 09:34
【?重走長(zhǎng)征路のC語(yǔ)言中static關(guān)鍵字?】

閱讀 1755·2021-09-28 09:36
godaddy主機(jī)ftp端口多少-godaddy主機(jī)怎么樣？

閱讀 1553·2021-09-22 14:59
css3 彈性布局和多列布局

閱讀 2777·2019-08-29 16:38
es6之迭代器

閱讀 2110·2019-08-26 13:40

亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

從零開(kāi)始寫(xiě)個(gè)編譯器吧 - 文法簡(jiǎn)介

相關(guān)文章

**從零開(kāi)始寫(xiě)個(gè)編譯器吧系列**

**從零開(kāi)始寫(xiě)個(gè)編譯器吧 - LL(1)**

**從零開(kāi)始寫(xiě)個(gè)編譯器吧 - tao 語(yǔ)言的文法定義（下）**

**從零開(kāi)始寫(xiě)個(gè)編譯器吧 - tao 語(yǔ)言的文法定義（上）**

**從零開(kāi)始寫(xiě)個(gè)編譯器吧 - 程序流控制**

發(fā)表評(píng)論

0條評(píng)論

stormzhang

男|高級(jí)講師

TA的文章

activate

Linux快速學(xué)習(xí)-vi編輯器常用命令

Pia云雙11活動(dòng)：新用戶(hù)全場(chǎng)5折，可選美國(guó)三網(wǎng)CN2 GIA月付10元起，香港純CN2永不混線(xiàn)月付

ASEMI肖特基二極管MBR20200FCT參數(shù)詳解

【?重走長(zhǎng)征路のC語(yǔ)言中static關(guān)鍵字?】

godaddy主機(jī)ftp端口多少-godaddy主機(jī)怎么樣？

css3 彈性布局和多列布局

es6之迭代器

最新活動(dòng)

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

從零開(kāi)始寫(xiě)個(gè)編譯器吧 - 文法簡(jiǎn)介

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！