[問題] 如何抓取網頁上的文字
因為小弟的論文有一部份要用到抓取網頁文字的java程式
所以參考了很多人寫的抓取網頁文字程式
目前看過的方法是透過分析網頁的html檔之後 再將文字過濾出來
但是現在的問題點就是我想要抓取的網頁文字不在該網頁的html檔裡
像是Gmap幫你做的路線規劃
圖: http://f8.wretch.yimg.com/noobking0/5/1768420813.jpg
紅色框起來的部份
(抱歉 我不是藉此宣傳我的相簿 我是真的不會縮圖 )
現在想請問板上有沒有人可以教我不用透過分析html的方式
或是告訴我哪本書的內容有教直接抓取網頁文字的方法
我想盡快解決這問題
另外 我想要順便問板上大眾要如何提升自己的java程式能力
之前我是找一本java書 一個章節一個章節自修
但是目前我的程式功力只能把別人寫的程式組合起來成一個怪物
自己看自己的程式都感到心寒 所以一直想要突破
請大家好心回答我的問題吧
感恩
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.129.19.118
推
02/16 11:50, , 1F
02/16 11:50, 1F
推
02/16 13:10, , 2F
02/16 13:10, 2F
推
02/16 14:17, , 3F
02/16 14:17, 3F
討論串 (同標題文章)
java 近期熱門文章
PTT數位生活區 即時熱門文章