討論串(共4篇) - [問題] 一個抓資料的問題 - 看板Python

看板 [ Python ]

討論串[問題] 一個抓資料的問題

共 4 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [問題] 一個抓資料的問題

推噓0(0推 )留言1則，0人參與作者KSJ (阿真)時間14年前 (2011/11/03 12:03)資訊

內容預覽:

我有試著把page直接開檔案寫入txt看看. 結果是正確的字. 代表idle的"print"在顯示上出了點問題不過cmd的沒有. 這邊用u似乎很怪裡面沒有ascii之外的字. 在str裡找unicode的字還蠻特別的. 不過找得到也ok. 在這裡print number時又是正常的了. 最底下會

(還有410個字)

Re: [問題] 一個抓資料的問題

推噓0(0推 )留言5則，0人參與作者poopoo888888 (阿川)時間14年前 (2011/11/03 08:40)資訊

內容預覽:

謝謝各位大大的幫忙！. 我學KSJ大直接用re去處理fetch到的網頁原始碼. 甚至不需要decode就可以正確顯示那些中文字. response = urllib.urlopen(url). page = response.read(). number = re.findall(u"frmlist

(還有524個字)

Re: [問題] 一個抓資料的問題

推噓0(0推 )留言0則，0人參與作者KSJ (阿真)時間14年前 (2011/11/02 20:55)資訊

內容預覽:

前文吃光光. 在cmd下看到的都是亂碼. 無論用big5 utf-8 cp950去對number做decode或是encode都沒用. 想請問怎麼會這樣呢？. 是因為re無法處理中文嗎？. 煩請大大們解惑. 謝謝！. cmd是指黑底的嗎?? 黑底的應該比較容易正常說雖然都轉成unicode就沒事了

(還有484個字)

[問題] 一個抓資料的問題

推噓3(3推 )留言10則，0人參與作者poopoo888888 (阿川)時間14年前 (2011/11/01 00:01)資訊

內容預覽:

我現正在抓一個網頁上的資料. http://service.moj.gov.tw/lawer/associList.asp?associName=%A5x%ABn%AB%DF%AEv%A4%BD%B7|. 網頁有大量像這樣的原始碼. <td width='16%'><font size='4' fa

(還有757個字)

首頁

尾頁