Re: [問題] GAE for JAVA parse HTML

看板java作者 (痞子軍團團長)時間11年前 (2013/10/29 12:30), 編輯推噓2(202)
留言4則, 3人參與, 最新討論串1/2 (看更多)
原本在公司休息的時候簡單回 結果原 po 說看不懂,只好重新回一次 我只是希望多一點人寫 GAE,絕對不是因為看到關鍵字 (謎之聲:欲蓋彌彰阿你 [指]) ※ 引述《hahaloveu (I'm girl.)》之銘言: : 小妹是個剛畢業的社會新鮮人, : 在課堂上學過JAVA、C等語言,不是非常精深。 這些廢話就不用講了,缺 P 幣可以用其他方式 XD : 因為工作的關係,使用了google app engine這個平台, : 該project的功能是去解析XML及HTML, : XML的部分經過千辛萬苦查詢相關資料後,有得到解答, : 但是HTML的部分弄了很久都不知道如何下手。 GAE / GWT 都一樣,有所謂的 JRE class 白名單 不在白名單上的 class 無法使用 GWT 是因為 JavaScript 本來能作的事情就跟(完整)的 Java 不一樣 GAE 則是因為一些安全性、分散式(或著說雲端三小的) 當然還有 $$ 的考量,所以不給你用完整的 JRE class 最主要的就是 File、socket (還有不能用 Swing,所以要噴圖... 我還不知道有啥方法 [死]) HTML parser 的核心應該還是一個高級的字串處理器 GAE 再怎麼無聊也不會去擋字串處理的東西 但是 HTML parser 的 library 為了作全套 通常會包含幫你連線 web server、處理 socket、IO stream 的鳥事 這個部份就很容易炸到 GAE 的限制 我當初的解法就是... 找一個 open source 的 html parser project 用它先寫好一個 example code,只是單純的餵字串給他 確認執行 OK 之後,再把這些 code 統統塞進 GAE 的 project 當中 GPE 就會噴一堆 error,告訴你哪些 class 他不收 慢慢砍掉那些 GAE 不收的 class,反覆確認你的 example code 還是能跑 (用標準 java application 的執行方式就不用理會那些 error) 當那些 error 都消失、你的 example code 還是能跑,基本上就大功告成了 我知道這個方法很 low 很蠢 但應該比自己去弄個 HTML parser 來的實在 當初有用古老的 HtmlParser 這個 project 弄成功過 不過後來覺得很無聊就不玩了,也沒有留 code 要當我是單純嘴砲也無訪 [逃] ==== 這樣都還看不懂,不管你是正妹還是正太,我都無法了 Orz -- 錢鍾書: 說出來的話 http://www.psmonkey.org 比不上不說出來的話 Java 版 cookcomic 版 只影射著說不出來的話 and more...... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.115.237.230

10/29 13:19, , 1F
html要能跑javascript才有用阿~不然regex就夠了 XD
10/29 13:19, 1F

10/29 14:50, , 2F
我聽得懂你說的方法,感謝你,我會再試試的。
10/29 14:50, 2F

10/29 14:54, , 3F
另外謝謝你提醒我那樣說會讓人以為我別有用意QQ
10/29 14:54, 3F

10/31 21:38, , 4F
推詳細解釋 我猜是卡在多執行緒的問題
10/31 21:38, 4F
文章代碼(AID): #1IRpdqGf (java)
文章代碼(AID): #1IRpdqGf (java)