[問題] 如何抓取網頁上的文字

看板java作者 (鯊魚~!)時間15年前 (2009/02/16 11:27), 編輯推噓3(300)
留言3則, 3人參與, 最新討論串1/4 (看更多)
因為小弟的論文有一部份要用到抓取網頁文字的java程式 所以參考了很多人寫的抓取網頁文字程式 目前看過的方法是透過分析網頁的html檔之後 再將文字過濾出來 但是現在的問題點就是我想要抓取的網頁文字不在該網頁的html檔裡 像是Gmap幫你做的路線規劃 圖: http://f8.wretch.yimg.com/noobking0/5/1768420813.jpg
紅色框起來的部份 (抱歉 我不是藉此宣傳我的相簿 我是真的不會縮圖 ) 現在想請問板上有沒有人可以教我不用透過分析html的方式 或是告訴我哪本書的內容有教直接抓取網頁文字的方法 我想盡快解決這問題 另外 我想要順便問板上大眾要如何提升自己的java程式能力 之前我是找一本java書 一個章節一個章節自修 但是目前我的程式功力只能把別人寫的程式組合起來成一個怪物 自己看自己的程式都感到心寒 所以一直想要突破 請大家好心回答我的問題吧 感恩 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.129.19.118

02/16 11:50, , 1F
default "Forbidden" response (403)
02/16 11:50, 1F

02/16 13:10, , 2F
最後的問題:從 Refactory 開始
02/16 13:10, 2F

02/16 14:17, , 3F
樓上: 是 Refactor/Refactoring 吧?
02/16 14:17, 3F
文章代碼(AID): #19cDqBEt (java)
文章代碼(AID): #19cDqBEt (java)