討論串(共2篇) - scrapy xpath extraction 以及其編碼的問題 - 看板Python

看板 [ Python ]

討論串scrapy xpath extraction 以及其編碼的問題

共 2 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: scrapy xpath extraction 以及其編碼的問題

推噓0(0推 )留言0則，0人參與作者panpass (往往往往)時間11年前 (2014/12/03 02:42)資訊

內容預覽:

import HTMLParser as HP. s = u"結婚並無Z>B". h = HP.HTMLParser(). print h.unescape(s).encode("utf-8"). --. ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 5.51.13.167. ※ 文章

scrapy xpath extraction 以及其編碼的問題

推噓0(0推 )留言5則，0人參與作者stevec (steve)時間11年前 (2014/11/29 19:20)資訊

內容預覽:

有點不曉得為什麼,想請各位大大看一下. 下面的程式碼只要是想利用scrapy 裡面的xpath extract一些我想要的info. raw_html_article_content_ 是儲存我想extract的部分資訊. raw 是儲存範圍比較大的部分. 所以理論上raw會包含raw_html_a

(還有1015個字)

首頁

尾頁