Re: [問題] 哪個瀏覽器配合插件可以邊瀏覽邊備份網站
※ 引述《Sam0907 (列)》之銘言:
: 所以想找個瀏覽器可以達成邊瀏覽就永久備份到電腦硬碟
: 包含文字以及圖片
: 以及包含強力的搜尋功能,可以在備份的檔案中輸入個關鍵字就可以查到想查的資料
: 或者是用瀏覽的日期進行搜尋
可以試試 Firefox + ScrapBook X + AutoSave
https://github.com/danny0838/firefox-scrapbook/wiki/Intro-%28zh-tw%29
https://github.com/danny0838/firefox-scrapbook/wiki/Addons-%28zh-tw%29
這樣的組合可以在瀏覽特定網址時自動擷取整個頁面,
包括文字、圖片、樣式通通抓下來。
ScrapBook X 內建還算不錯的全文搜尋功能,
支援多關鍵字以 and not 連結,也支援 regexp 搜尋。
效能方面,
我有個測試數據是從 1825 個資料項(共 1.27 GB)中搜尋某關鍵詞,
找出 1917 筆結果,過程不到 3 秒鐘。
不過搜尋前必須先建立快取,
1825 個資料項從頭建立全文搜尋快取約 3~4 分鐘,
如果是建立後再重建(無更新的會自動略過),大約 20 秒以內完成。
就字面上來說,應該都符合原問的需求,
只是...實際上可能不見得有想像中的好用...
首先,每瀏覽一個網頁就擷取,會拖慢速度。
其次,現在很多網頁的肥胖程度是超乎想像的,
比如,用 ScrapBook X 擷取一個臉書頁面,
包含完整的文字、圖片、樣式,大概要 1.6 MB,
臉書很多圖片、樣式表是重覆的,每擷取一頁就複製一次,很浪費空間。
我們簡單算一下,假設一天看 100 個網頁,每個網頁平均 1.5MB,
那麼一年後將會吃掉 1.5*100*365/1024 = 53.5 GB 的硬碟空間。
當然,如果是專看圖多的動漫網站,那絕對不只。
另外,很多 Web 應用程式其實沒有真正的換頁,像臉書、噗浪、gmail,
往往是在同一個網頁動態載入新的訊息串、新的信件等內容,
由於這不是「換頁」,因此 AutoSave 不會在載入這些東西後自動儲存,這也要留意。
我個人不覺得備份所有網頁是很有用的事,
頂多看到覺得有價值的頁面手動備份一下就好,
其他網頁若是無預警掛點,也多半有機會可以從 Google Cache 或 Web Archive 找回。
不過每個人的需求不同,要不要用,要怎麼用,就看施主囉。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.57.65
※ 文章網址: http://www.ptt.cc/bbs/Browsers/M.1406399439.A.0B2.html
※ 編輯: danny0838 (114.45.57.65), 07/27/2014 02:36:35
※ 編輯: danny0838 (114.45.57.65), 07/27/2014 02:44:07
※ 編輯: danny0838 (114.45.57.65), 07/27/2014 02:46:28
※ 編輯: danny0838 (114.45.57.65), 07/27/2014 02:55:39
推
07/27 10:54, , 1F
07/27 10:54, 1F
→
08/21 23:28, , 2F
08/21 23:28, 2F
推
01/15 00:52, , 3F
01/15 00:52, 3F
→
01/15 00:53, , 4F
01/15 00:53, 4F
→
01/15 00:53, , 5F
01/15 00:53, 5F
→
01/15 00:54, , 6F
01/15 00:54, 6F
→
02/07 04:23, , 7F
02/07 04:23, 7F
→
02/07 04:24, , 8F
02/07 04:24, 8F
→
02/07 04:25, , 9F
02/07 04:25, 9F
目前沒有很簡單的方法,
如有較明顯的主次關係,可考慮一開始就用多層擷取,
否則恐怕只有對抓下來的 HTML 原始碼尋找取代一途了。
→
04/19 01:35, , 10F
04/19 01:35, 10F
→
04/19 01:36, , 11F
04/19 01:36, 11F
→
04/19 01:36, , 12F
04/19 01:36, 12F
不太清楚什麼是「存個別不同頁面 同時分享給別人」...
ScrapBook 抓下來的其實是以資料夾為單位的 HTML 及相關檔案集,
如果是單個單個獨立的 ScrapBook 頁面,可個別匯出成資料夾;
如果是多個自成一組的 ScrapBook 頁面,
把那些頁面從舊的 ScrapBook 匯出,
啟用多重 ScrapBook 開個新的,再匯入那幾個頁面,
然後可用 工具 > 將資料列表匯出為 HTML 建立目錄結構,更新個全文快取,
就可以 copy 整個 ScrapBook 資料夾分享給別人,
或把整個 ScrapBook 資料夾上傳到網路空間給別人看。
可參考: http://j.mp/1KVmZT5
我不會很常看這裡,如有問題可到官網或版本庫的議題回報發帖,比較會看到:
https://addons.mozilla.org/zh-tw/firefox/addon/scrapbook-x/
https://github.com/danny0838/firefox-scrapbook/issues
※ 編輯: danny0838 (59.115.3.170), 05/11/2015 01:23:52
討論串 (同標題文章)
Browsers 近期熱門文章
PTT數位生活區 即時熱門文章