[問題] 爬蟲資料在註解裡面 抓不出來已刪文
目前遇到一些問題
想請前輩們指教
使用beautifulSoup嘗試爬一個表格
有個資訊被包在註解裡面
剛好對這個訊息有興趣 但是卻轉不出來
原始資料
<tr>
<td>序號</td>
<!-- td>取號</td-->
<td>天氣</td>
</tr>
EX:
<tr>
<td>14</td>
<!-- td>05291023337001a</td-->
<td>晴天</td>
</tr>
程式碼
soup = BeautifulSoup(r.text,"html")
tbls=soup.find('table', id = "dataTable")
tbtr=tbls.find_all('tr')
print(tbtr[14])
print(tbtr[14].text)
輸出
<tr>
<td>14</td>
<!-- td>05291023337001a</td-->
<td>晴天</td>
</tr>
14
晴天
剛好我需要的資料是被註解(<!-- td>*****</td-->)包著
型態是<class 'bs4.element.Tag'>
也轉不去字串
不然想說可以自己PARSE TAG的方式
請問前輩們可以分享該如何擷取嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.46.89.235 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1622088178.A.5F6.html
Python 近期熱門文章
PTT數位生活區 即時熱門文章