[問題] 爬蟲資料在註解裡面 抓不出來已刪文

看板Python作者 (misimisu)時間4年前 (2021/05/27 12:02), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
目前遇到一些問題 想請前輩們指教 使用beautifulSoup嘗試爬一個表格 有個資訊被包在註解裡面 剛好對這個訊息有興趣 但是卻轉不出來 原始資料 <tr> <td>序號</td> <!-- td>取號</td--> <td>天氣</td> </tr> EX: <tr> <td>14</td> <!-- td>05291023337001a</td--> <td>晴天</td> </tr> 程式碼 soup = BeautifulSoup(r.text,"html") tbls=soup.find('table', id = "dataTable") tbtr=tbls.find_all('tr') print(tbtr[14]) print(tbtr[14].text) 輸出 <tr> <td>14</td> <!-- td>05291023337001a</td--> <td>晴天</td> </tr> 14 晴天 剛好我需要的資料是被註解(<!-- td>*****</td-->)包著 型態是<class 'bs4.element.Tag'> 也轉不去字串 不然想說可以自己PARSE TAG的方式 請問前輩們可以分享該如何擷取嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.46.89.235 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1622088178.A.5F6.html
文章代碼(AID): #1WhndoNs (Python)
文章代碼(AID): #1WhndoNs (Python)