Re: [問題] 如何學寫COMPILER? [純拋磚引玉]

看板Programming作者時間18年前 (2007/04/18 03:32), 編輯推噓3(300)
留言3則, 3人參與, 最新討論串10/38 (看更多)
※ 引述《sniffer@kkcity.com.tw ( )》之銘言: > ※ 引述《tinlans.bbs@whshs.cs.nccu.edu.tw (汀)》之銘言: > > 而且是針對 flex & bison 的: > > 當初 4.0 之所以把 C++ parser 整個拿純 C 手工重寫, > > 有一大原因就是 flex & bison 生出來的 code 太難 debug 了, > > 而 C++ 的 syntax 又是極其複雜 (對 compiler 而言), > C++ 語法不複雜, 但是容易搞錯, 排列組合過多 對人來說是這樣, 對 compiler 來說比較難處理。 > parser 對 compiler 來說是很小的一部份, 甚至該當成獨立的模組 本來就是如此, 但是就 user 的角度來看, 送合法的 syntax 進去連 parsing 都不過, 那後面的東西什麼都不用談。 > C++ 的 templates 是 define 擴充版, 這玩意個人認為比 define 更難 debug > trace 的時候還更是困難, 跳來跳去, 而且不同 compiler 連 STL 版本都不同 > 不是每個寫 C++ 的人都會去鑽一堆特殊寫法, 可讀性不是只針對 C++ 上癮者 C++ 沒有什麼所謂的特殊寫法, 基礎書籍 (聖經本) 讀過一遍什麼都可以看得懂, 只是有沒有那個毅力去慢慢解析而已。 #define 根本連 debug 都不用講, 因為沒有一種 debugger 能 step into macro, 如果你用 #define 做了一個 function-like macro 內含 100 行 code, 你用 debugger 去 step into 也是直接一口氣飛過那 100 行, 如果這 100 行裡面有問題根本求助無門 (好吧,自己複製貼上去再取代文字是一種方法), 而 template 你卻可以直接很快樂的 step into。 至於 trace 這種東西是有技巧的, 沒事你不需要進去看 STL 寫了什麼, 會拿 debugger 去 step into 到 STL 裡面的人大概也是因為不懂 STL, 該用 step over (next) 的時候就該用 step over, 什麼都 into 進去那還得了, 不管是 debug 還是 trace 都不應該是這樣玩的。 有非常多人在 debug C++ 程式都忘記了一件事, 今天是因為很多 C++ compiler 不支援 export, 所以才把 template 相關的 library 實作碼放在 header 上, 以致於它的實作碼在多數情況下是可見的, 結果在 debug 的時候就傻傻的 step into 進去, 這是不對的, 就像你在 debug C 程式的時候, 你不會閒到 step into 進 printf()、strcpy() 之類的 lib function 一樣, 你沒有理由在使用 STL 的時候 step into 到 vector::push_back() 裡面。 唯一受人詬病的應該是 template 實際引數表示法的易讀性, 像是 string 會被展開成 std::basic_string<...> 一大串的狀況, 但這種東西其實是 compiler 和 debugger 偷懶沒加工所致, 其實如果每套 STL 實作能提供相關的資訊檔, 這個資訊檔以 compiler 和 debugger 規範的某種公約來撰寫, 這類訊息就能夠被化簡, 事實上就算沒有化簡, 寫了幾個月的人多少有能力去抓到重點是哪, 抓不到重點的大概也是白學白寫了。 > 真正優良的程式靠的是規劃, 如 mozilla 用的 apple coding style > mozilla 的程式非常好 debug, 其中的 javascript parser 比 C++ 不知麻煩多少倍 當你使用到 library 或是 tool (code generator) 時, debug 的難度本來就會上升, 這時跟「自己寫的部分」的程式規劃優劣沒有什麼關聯性, library 通常會提供「逐步建構」和「啟動」的介面, 而 tool 通常是事先建構好再產生一個啟動介面, 前者 user 可以很清楚的知道過程 (主要流程還是自己寫的 code), 所以非常的容易 debug 和 trace, 後者的主要流程則是被 tool 自動產生, 像是從一個都是數字的巨大 array 讀出某某值做一些事情, 然後送進 case label 成千上萬又都是 magic number 的 switch 敘述裡, 只有次要流程才是自己寫的 code, 何者容易 debug 其實顯而易見。 > javascript 充滿著例外, 不完整的語句也還是要能跑, 它的 parser 才算經典 就我所知 browser 有權利拒絕這種東西並送出錯誤訊息, 只是因為 user 會覺得這種 browser 很難用, 所以不少 browser 才設計容錯機制應對, 但是容錯機制跟語法複雜度是兩個不同面向的技術, 跟 C++ parser 牽涉的複雜度有著本質上的不同, 並沒有任何可以加以比較的空間存在。 -- Name: Tseng, Ling-hua E-mail Address: uranus@it.muds.net School: National Tsing Hua University Department: Computer Science Interesting: C++, Compiler, PL/PD, OS, VM, Large-scale software design Researching: Software pipelining for VLIW architectures Homepage: https://it.muds.net/~uranus -- ╔═══╗ ┼────────────────────────╮ 狂狷 Origin:[ 狂 狷 年 少 ] whshs.cs.nccu.edu.tw ╰─╮ 年少 ┼╮ < IP:140.119.164.252 > ╰─╮ ╚╦═╦╝ From:61-230-229-51.dynamic.hinet.net ─╨─╨─ KGBBS 遨翔"BBS"的狂狷不馴;屬於年少的輕狂色彩

04/18 23:20, , 1F
04/18 23:20, 1F

04/29 16:08, , 2F
04/29 16:08, 2F

05/01 16:35, , 3F
再推
05/01 16:35, 3F
文章代碼(AID): #169I2o00 (Programming)
討論串 (同標題文章)
文章代碼(AID): #169I2o00 (Programming)