看板
[ Python ]
討論串[問題] 一個抓資料的問題
共 4 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
我有試著把page直接開檔案寫入txt看看. 結果是正確的字. 代表idle的"print"在顯示上出了點問題 不過cmd的沒有. 這邊用u似乎很怪 裡面沒有ascii之外的字. 在str裡找unicode的字還蠻特別的. 不過找得到也ok. 在這裡print number時又是正常的了. 最底下會
(還有410個字)
內容預覽:
謝謝各位大大的幫忙!. 我學KSJ大直接用re去處理fetch到的網頁原始碼. 甚至不需要decode就可以正確顯示那些中文字. response = urllib.urlopen(url). page = response.read(). number = re.findall(u"frmlist
(還有524個字)
內容預覽:
前文吃光光. 在cmd下看到的都是亂碼. 無論用big5 utf-8 cp950去對number做decode或是encode都沒用. 想請問怎麼會這樣呢?. 是因為re無法處理中文嗎?. 煩請大大們解惑. 謝謝!. cmd是指黑底的嗎?? 黑底的應該比較容易正常說 雖然都轉成unicode就沒事了
(還有484個字)
內容預覽:
我現正在抓一個網頁上的資料. http://service.moj.gov.tw/lawer/associList.asp?associName=%A5x%ABn%AB%DF%AEv%A4%BD%B7|. 網頁有大量像這樣的原始碼. <td width='16%'><font size='4' fa
(還有757個字)
首頁
上一頁
1
下一頁
尾頁