Re: [問題] GAE for JAVA parse HTML
原本在公司休息的時候簡單回
結果原 po 說看不懂,只好重新回一次
我只是希望多一點人寫 GAE,絕對不是因為看到關鍵字
(謎之聲:欲蓋彌彰阿你 [指])
※ 引述《hahaloveu (I'm girl.)》之銘言:
: 小妹是個剛畢業的社會新鮮人,
: 在課堂上學過JAVA、C等語言,不是非常精深。
這些廢話就不用講了,缺 P 幣可以用其他方式 XD
: 因為工作的關係,使用了google app engine這個平台,
: 該project的功能是去解析XML及HTML,
: XML的部分經過千辛萬苦查詢相關資料後,有得到解答,
: 但是HTML的部分弄了很久都不知道如何下手。
GAE / GWT 都一樣,有所謂的 JRE class 白名單
不在白名單上的 class 無法使用
GWT 是因為 JavaScript 本來能作的事情就跟(完整)的 Java 不一樣
GAE 則是因為一些安全性、分散式(或著說雲端三小的)
當然還有 $$ 的考量,所以不給你用完整的 JRE class
最主要的就是 File、socket
(還有不能用 Swing,所以要噴圖... 我還不知道有啥方法 [死])
HTML parser 的核心應該還是一個高級的字串處理器
GAE 再怎麼無聊也不會去擋字串處理的東西
但是 HTML parser 的 library 為了作全套
通常會包含幫你連線 web server、處理 socket、IO stream 的鳥事
這個部份就很容易炸到 GAE 的限制
我當初的解法就是... 找一個 open source 的 html parser project
用它先寫好一個 example code,只是單純的餵字串給他
確認執行 OK 之後,再把這些 code 統統塞進 GAE 的 project 當中
GPE 就會噴一堆 error,告訴你哪些 class 他不收
慢慢砍掉那些 GAE 不收的 class,反覆確認你的 example code 還是能跑
(用標準 java application 的執行方式就不用理會那些 error)
當那些 error 都消失、你的 example code 還是能跑,基本上就大功告成了
我知道這個方法很 low 很蠢
但應該比自己去弄個 HTML parser 來的實在
當初有用古老的 HtmlParser 這個 project 弄成功過
不過後來覺得很無聊就不玩了,也沒有留 code
要當我是單純嘴砲也無訪 [逃]
====
這樣都還看不懂,不管你是正妹還是正太,我都無法了 Orz
--
錢鍾書: 說出來的話
http://www.psmonkey.org
比不上不說出來的話
Java 版 cookcomic 版
只影射著說不出來的話
and more......
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.115.237.230
→
10/29 13:19, , 1F
10/29 13:19, 1F
推
10/29 14:50, , 2F
10/29 14:50, 2F
→
10/29 14:54, , 3F
10/29 14:54, 3F
推
10/31 21:38, , 4F
10/31 21:38, 4F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
java 近期熱門文章
PTT數位生活區 即時熱門文章