PTT數位生活區 / Perl

[問題] 抓回來的網頁去除html標籤後出現部份亂碼

看板Perl作者redmist (....N )時間17年前 (2007/12/18 13:13)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/3 (看更多)

寫了一支程式到網路上抓資料，用HTML::FormatText模組去除html標籤後會出現部份亂碼(不是全部，甚至只有一小部份)，是什麼原因呢？ code如下 use LWP::UserAgent; use HTML::Parse; use HTML::FormatText; my $ua = LWP::UserAgent->new; $ua->agent("MyApp/0.1 "); my $word = '生氣'; my $response = $ua->post( 'http://www.sinica.edu.tw/ftms-bin/scripts/look_for_sym.pl', [ 'kw0' => $word ], ); if ($response->is_success) { my $res = $response->content; #$res =~s/\r\n/\n/; $ascii = HTML::FormatText->new->format(parse_html($res)); print $ascii; } else { die $response->status_line; } 印出來的部份結果如下 (1) 書卷氣 (2) 書生氣共有2茼P義詞為何會有小部份奇怪的亂碼呢？ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.241.208

‣ 返回看板[ Perl ] 程設

‣ 更多 redmist 的文章

文章代碼(AID): #17PrRdve (Perl)

討論串 (同標題文章)

以下文章回應了本文：

1

1

Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼

17年前, 12/19

完整討論串 (本文為第 1 之 3 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼

16年前, 07/30

1

1

Re: [問題] 抓回來的網頁去除html標籤後出現部份亂碼

17年前, 12/19

[問題] 抓回來的網頁去除html標籤後出現部份亂碼

17年前, 12/18

在新視窗開啟完整討論串 (共3篇)

Perl 近期熱門文章

2

15

[問題] 如何改善大文件的讀寫效能

11月前, 07/12

1

2

Re: [問題] 參照變數宣告及記憶體位置問題

2年前, 02/13

1

2

[問題] 參照變數宣告及記憶體位置問題

2年前, 02/07

3

5

Learing Perl 第八版中文版出版了

3年前, 06/22

2

4

[請益] 請教terminal 餵正規表示法給perl問題

4年前, 04/10

1

9

[問題] 是不是要放棄perl了

4年前, 03/02

1

1

[問題] 請問如何建立新的Row？(代po)

4年前, 11/23

1

1

[問題] regexp的replace？

4年前, 11/03

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

4

13

Re: [情報] 德亞映眾5080未稅31k台幣

[ PC_Shopping ]

1小時前, 06/30

8

17

[心得] 泰坦軍團 G27T8W 第四代QD-OLED

[ PC_Shopping ]

1小時前, 06/30

7

24

[問題] 長輩手機遺失，line如何轉移原帳號？

2小時前, 06/30

10

27

[討論] iphone17pro 傳聞可能會有均熱板大家會

3小時前, 06/30

10

18

[心得] STAX SR-X9000 雖遲但到

4小時前, 06/30

25

114

[菜單] 這次降階29k菜單煩請幫審閱

[ PC_Shopping ]

4小時前, 06/30

3

6

[心得] Sivga p-ii 溫暖的萬元平板木殼

4小時前, 06/30

7

11

[請益] 到底要不要ROON下去？

5小時前, 06/30

更多即時熱門文章 >>

‣ 返回看板[ Perl ] 程設

‣ 更多 redmist 的文章

文章代碼(AID): #17PrRdve (Perl)