[問題] 抓取網頁中的pdf檔案
我想要抓取某個網頁中的PDF檔案
PDF產生的方式是先傳序號給該網址
我使用
use IO::Socket;
print $socket "GET Query.aspx?pn=00525881&imageindex=1 HTTP/1.1\r\n";
而它顯示的網頁有html和pdf
我該如何把pdf存下來啊?
#Server Response
$result = "";
while (my $line=<$socket>) {
$result .= $line;
}
#HTTP Server Response Header
$result = substr($result,index($result,"\x0d\x0a\x0d\x0a")+4);
#存檔
open F, "> PDF_file" or die "Can't write into filename";
print F $result;
close F;
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.18.90
推
12/02 12:02, , 1F
12/02 12:02, 1F
推
12/02 12:03, , 2F
12/02 12:03, 2F
推
12/02 12:04, , 3F
12/02 12:04, 3F
推
12/04 14:58, , 4F
12/04 14:58, 4F
→
12/04 15:00, , 5F
12/04 15:00, 5F
→
12/04 15:01, , 6F
12/04 15:01, 6F
Perl 近期熱門文章
PTT數位生活區 即時熱門文章