Re: [問題] 抓取完整網頁(包含css、icon 小圖)
※ 引述《BLUBLU (the sight of the eyes)》之銘言:
: 請問一下
: 以往我在抓網頁時
: 都是用 WWW:Mechanize 及 LWP::Simple 模組
: 但都只抓下HTML的原始碼
: 若我想做到,可以抓下完整的網頁
: (包含css、Icon 網頁上的小圖示)
: 就像用瀏覽器 另存新檔存成 (網頁,完整 *.htm;*.html)
: 的方式一樣(會有一資料夾存上述那些圖形、css元件)
: 請問還要搭配什麼才可以做到呢 ?
: 麻煩請提示一下 感謝阿 <(_ _)>
1. Parse 網頁上的 CSS 與 ICON 等所有你想抓下來的東西的Tag內容.
2. 因為你已經把它們Parse好了, 所以用它們的URL把它們download下來.
3. 若你需要修改 html檔來link下載後的檔案, 就修改它們的 link到local file
--
Do not depend on others without effort...
當我年輕時,請教別人問題時常聽到上面那句話. 當時心裏偶而會有些小小抱怨.
當時間過去,我偶而會想到上面那句話, 心中十分感謝當初告訴我那句話的人.
當發現問題時,最有價值的不是問題的答案,
而是找到解決的方向,並在努力的過程裡具備解決問題的能力.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 221.169.217.133
推
07/19 14:14, , 1F
07/19 14:14, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
Perl 近期熱門文章
PTT數位生活區 即時熱門文章