將某一種程序設(shè)計(jì)語言寫的程序翻譯成等價(jià)的另一種語言的程序的程序, 稱之為編譯程序(compiler) .
詞法分析的任務(wù)是對(duì)由字符組成的單詞進(jìn)行處理,從左至右逐個(gè)字符地對(duì)源程序進(jìn)行掃描,產(chǎn)生一個(gè)個(gè)的單詞符號(hào),把作為字符串的源程序改造成為單詞符號(hào)串的中間程序。執(zhí)行詞法分析的程序稱為詞法分析程序或掃描器。
源程序中的單詞符號(hào)經(jīng)掃描器分析,一般產(chǎn)生二元式:?jiǎn)卧~種別;單詞自身的值。單詞種別通常用整數(shù)編碼,如果一個(gè)種別只含一個(gè)單詞符號(hào),那么對(duì)這個(gè)單詞符號(hào),種別編碼就完全代表它自身的值了。若一個(gè)種別含有許多個(gè)單詞符號(hào),那么,對(duì)于它的每個(gè)單詞符號(hào),除了給出種別編碼以外,還應(yīng)給出自身的值。
詞法分析器一般來說有兩種方法構(gòu)造:手工構(gòu)造和自動(dòng)生成。手工構(gòu)造可使用狀態(tài)圖進(jìn)行工作,自動(dòng)生成使用確定的有限自動(dòng)機(jī)來實(shí)現(xiàn)。
編譯程序的語法分析器以單詞符號(hào)作為輸入,分析單詞符號(hào)串是否形成符合語法規(guī)則的語法單位,如表達(dá)式、賦值、循環(huán)等,最后看是否構(gòu)成一個(gè)符合要求的程序,按該語言使用的語法規(guī)則分析檢查每條語句是否有正確的邏輯結(jié)構(gòu),程序是最終的一個(gè)語法單位。編譯程序的語法規(guī)則可用上下文無關(guān)文法來刻畫。
語法分析的方法分為兩種:自上而下分析法和自下而上分析法。自上而下就是從文法的開始符號(hào)出發(fā),向下推導(dǎo),推出句子。而自下而上分析法采用的是移進(jìn)歸約法,基本思想是:用一個(gè)寄存符號(hào)的先進(jìn)后出棧,把輸入符號(hào)一個(gè)一個(gè)地移進(jìn)棧里,當(dāng)棧頂形成某個(gè)產(chǎn)生式的一個(gè)候選式時(shí),即把棧頂?shù)倪@一部分歸約成該產(chǎn)生式的左鄰符號(hào)。
中間代碼是源程序的一種內(nèi)部表示,或稱中間語言。中間代碼的作用是可使編譯程序的結(jié)構(gòu)在邏輯上更為簡(jiǎn)單明確,特別是可使目標(biāo)代碼的優(yōu)化比較容易實(shí)現(xiàn)中間代碼,即為中間語言程序,中間語言的復(fù)雜性介于源程序語言和機(jī)器語言之間。中間語言有多種形式,常見的有逆波蘭記號(hào)、四元式、三元式和樹。
代碼優(yōu)化是指對(duì)程序進(jìn)行多種等價(jià)變換,使得從變換后的程序出發(fā),能生成更有效的目標(biāo)代碼。所謂等價(jià),是指不改變程序的運(yùn)行結(jié)果。所謂有效,主要指目標(biāo)代碼運(yùn)行時(shí)間較短,以及占用的存儲(chǔ)空間較小。這種變換稱為優(yōu)化。
有兩類優(yōu)化:一類是對(duì)語法分析后的中間代碼進(jìn)行優(yōu)化,它不依賴于具體的計(jì)算機(jī);另一類是在生成目標(biāo)代碼時(shí)進(jìn)行的,它在很大程度上依賴于具體的計(jì)算機(jī)。對(duì)于前一類優(yōu)化,根據(jù)它所涉及的程序范圍可分為局部?jī)?yōu)化、循環(huán)優(yōu)化和全局優(yōu)化三個(gè)不同的級(jí)別。
目標(biāo)代碼生成是編譯的最后一個(gè)階段。目標(biāo)代碼生成器把語法分析后或優(yōu)化后的中間代碼變換成目標(biāo)代碼。目標(biāo)代碼有三種形式:
① 可以立即執(zhí)行的機(jī)器語言代碼,所有地址都重定位;
② 待裝配的機(jī)器語言模塊,當(dāng)需要執(zhí)行時(shí),由連接裝入程序把它們和某些運(yùn)行程序連接起來,轉(zhuǎn)換成能執(zhí)行的機(jī)器語言代碼;
③ 匯編語言代碼,須經(jīng)過匯編程序匯編后,成為可執(zhí)行的機(jī)器語言代碼。
目標(biāo)代碼生成階段應(yīng)考慮直接影響到目標(biāo)代碼速度的三個(gè)問題:一是如何生成較短的目標(biāo)代碼;二是如何充分利用計(jì)算機(jī)中的寄存器,減少目標(biāo)代碼訪問存儲(chǔ)單元的次數(shù);三是如何充分利用計(jì)算機(jī)指令系統(tǒng)的特點(diǎn),以提高目標(biāo)代碼的質(zhì)量。
編譯過程中源程序的各種信息被保留在種種不同的表格,編譯各階段的工作都涉及到構(gòu)造、查找、或更新有關(guān)的表格。
編譯程序的公共輔助部分。對(duì)源程序中的各種量進(jìn)行管理,登記在相應(yīng)的表格。編譯程序處理時(shí)通過查表得到所需的信息。
如果編譯過程中發(fā)現(xiàn)源程序有錯(cuò)誤,編譯程序應(yīng)報(bào)告錯(cuò)誤的性質(zhì)和錯(cuò)誤的發(fā)生的地點(diǎn),并且將錯(cuò)誤所造成的影響限制在盡可能小的范圍內(nèi),使得源程序的其余部分能繼續(xù)被編譯下去,有些編譯程序還能自動(dòng)糾正錯(cuò)誤,這些工作由錯(cuò)誤處理程序完成。
需要注意的是,一般上編譯器只做語法檢查和最簡(jiǎn)單的語義檢查,而不檢查程序的邏輯。