Re: [問題] 如何學寫COMPILER? [純拋磚引玉]
※ 引述《sniffer@kkcity.com.tw ( )》之銘言:
> ※ 引述《tinlans.bbs@whshs.cs.nccu.edu.tw (汀)》之銘言:
> > 而且是針對 flex & bison 的:
> > 當初 4.0 之所以把 C++ parser 整個拿純 C 手工重寫,
> > 有一大原因就是 flex & bison 生出來的 code 太難 debug 了,
> > 而 C++ 的 syntax 又是極其複雜 (對 compiler 而言),
> C++ 語法不複雜, 但是容易搞錯, 排列組合過多
對人來說是這樣,
對 compiler 來說比較難處理。
> parser 對 compiler 來說是很小的一部份, 甚至該當成獨立的模組
本來就是如此,
但是就 user 的角度來看,
送合法的 syntax 進去連 parsing 都不過,
那後面的東西什麼都不用談。
> C++ 的 templates 是 define 擴充版, 這玩意個人認為比 define 更難 debug
> trace 的時候還更是困難, 跳來跳去, 而且不同 compiler 連 STL 版本都不同
> 不是每個寫 C++ 的人都會去鑽一堆特殊寫法, 可讀性不是只針對 C++ 上癮者
C++ 沒有什麼所謂的特殊寫法,
基礎書籍 (聖經本) 讀過一遍什麼都可以看得懂,
只是有沒有那個毅力去慢慢解析而已。
#define 根本連 debug 都不用講,
因為沒有一種 debugger 能 step into macro,
如果你用 #define 做了一個 function-like macro 內含 100 行 code,
你用 debugger 去 step into 也是直接一口氣飛過那 100 行,
如果這 100 行裡面有問題根本求助無門
(好吧,自己複製貼上去再取代文字是一種方法),
而 template 你卻可以直接很快樂的 step into。
至於 trace 這種東西是有技巧的,
沒事你不需要進去看 STL 寫了什麼,
會拿 debugger 去 step into 到 STL 裡面的人大概也是因為不懂 STL,
該用 step over (next) 的時候就該用 step over,
什麼都 into 進去那還得了,
不管是 debug 還是 trace 都不應該是這樣玩的。
有非常多人在 debug C++ 程式都忘記了一件事,
今天是因為很多 C++ compiler 不支援 export,
所以才把 template 相關的 library 實作碼放在 header 上,
以致於它的實作碼在多數情況下是可見的,
結果在 debug 的時候就傻傻的 step into 進去,
這是不對的,
就像你在 debug C 程式的時候,
你不會閒到 step into 進 printf()、strcpy() 之類的 lib function 一樣,
你沒有理由在使用 STL 的時候 step into 到 vector::push_back() 裡面。
唯一受人詬病的應該是 template 實際引數表示法的易讀性,
像是 string 會被展開成 std::basic_string<...> 一大串的狀況,
但這種東西其實是 compiler 和 debugger 偷懶沒加工所致,
其實如果每套 STL 實作能提供相關的資訊檔,
這個資訊檔以 compiler 和 debugger 規範的某種公約來撰寫,
這類訊息就能夠被化簡,
事實上就算沒有化簡,
寫了幾個月的人多少有能力去抓到重點是哪,
抓不到重點的大概也是白學白寫了。
> 真正優良的程式靠的是規劃, 如 mozilla 用的 apple coding style
> mozilla 的程式非常好 debug, 其中的 javascript parser 比 C++ 不知麻煩多少倍
當你使用到 library 或是 tool (code generator) 時,
debug 的難度本來就會上升,
這時跟「自己寫的部分」的程式規劃優劣沒有什麼關聯性,
library 通常會提供「逐步建構」和「啟動」的介面,
而 tool 通常是事先建構好再產生一個啟動介面,
前者 user 可以很清楚的知道過程 (主要流程還是自己寫的 code),
所以非常的容易 debug 和 trace,
後者的主要流程則是被 tool 自動產生,
像是從一個都是數字的巨大 array 讀出某某值做一些事情,
然後送進 case label 成千上萬又都是 magic number 的 switch 敘述裡,
只有次要流程才是自己寫的 code,
何者容易 debug 其實顯而易見。
> javascript 充滿著例外, 不完整的語句也還是要能跑, 它的 parser 才算經典
就我所知 browser 有權利拒絕這種東西並送出錯誤訊息,
只是因為 user 會覺得這種 browser 很難用,
所以不少 browser 才設計容錯機制應對,
但是容錯機制跟語法複雜度是兩個不同面向的技術,
跟 C++ parser 牽涉的複雜度有著本質上的不同,
並沒有任何可以加以比較的空間存在。
--
Name: Tseng, Ling-hua E-mail Address: uranus@it.muds.net
School: National Tsing Hua University Department: Computer Science
Interesting: C++, Compiler, PL/PD, OS, VM, Large-scale software design
Researching: Software pipelining for VLIW architectures
Homepage: https://it.muds.net/~uranus
--
╔═══╗ ┼────────────────────────╮
║狂狷 ║ │* Origin:[ 狂 狷 年 少 ] whshs.cs.nccu.edu.tw ╰─╮
║ 年少║ ┼╮ < IP:140.119.164.252 > ╰─╮
╚╦═╦╝ ╰ * From:61-230-229-51.dynamic.hinet.net
─╨─╨─ KGBBS ─ ◎ 遨翔"BBS"的狂狷不馴;屬於年少的輕狂色彩 ◎
推
04/18 23:20, , 1F
04/18 23:20, 1F
推
04/29 16:08, , 2F
04/29 16:08, 2F
推
05/01 16:35, , 3F
05/01 16:35, 3F
討論串 (同標題文章)
完整討論串 (本文為第 10 之 38 篇):
Programming 近期熱門文章
PTT數位生活區 即時熱門文章
12
21