看板 [ Python ]
討論串scrapy xpath extraction 以及其編碼的問題
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者panpass (往往往往)時間11年前 (2014/12/03 02:42), 編輯資訊
0
0
1
內容預覽:
import HTMLParser as HP. s = u"結婚並無Z>B". h = HP.HTMLParser(). print h.unescape(s).encode("utf-8"). --. 發信站: 批踢踢實業坊(ptt.cc), 來自: 5.51.13.167. 文章

推噓0(0推 0噓 5→)留言5則,0人參與, 最新作者stevec (steve)時間11年前 (2014/11/29 19:20), 11年前編輯資訊
0
0
2
內容預覽:
有點不曉得為什麼,想請各位大大看一下. 下面的程式碼只要是想利用scrapy 裡面的xpath extract一些我想要的info. raw_html_article_content_ 是儲存我想extract的部分資訊. raw 是儲存範圍比較大的部分. 所以理論上raw會包含raw_html_a
(還有1015個字)
首頁
上一頁
1
下一頁
尾頁