[問題] 爬蟲 期貨表格

看板Python作者 (???N)時間6年前 (2018/11/20 10:45), 6年前編輯推噓0(001)
留言1則, 1人參與, 6年前最新討論串1/1
code https://pastebin.com/7nj8i6RD 如下: import requests import sys import re from bs4 import BeautifulSoup import pandas import lxml Juridical_person = "http://www.taifex.com.tw/cht/3/futContractsDateExcel" df = pandas.read_html(Juridical_person) print(df[1]) pandas讀進來之後,print出來發現表格歪掉了 可能是前兩欄有些儲存格合併的關係 我該怎麼呈現和網頁一樣的效果呢? 我應該在讀進來之前就先對html作處理 還是讀進來之後再對df作表格的排版 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.39.16.239 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1542681935.A.2B9.html

11/20 16:13, 6年前 , 1F
或許用BeautifulSoup抓回table後, 再做清理解析比較好
11/20 16:13, 1F
感謝回覆 我相信不論pandas讀進來之前還是之後作處理應該都能解決 礙於新手對語法不熟,兩種方法都不知該如何具體的寫出code 經過下午在網上翻閱文章終於解決,在此使用的方法為後者 將print(df[1])那一行 改為下列兩行 df[1][13:15] = df[1][13:15].shift(2,None,'columns') print(df[1].loc[12:14,9:14]) 程式碼如下 https://pastecode.xyz/view/157bc1ba ※ 編輯: WhiteComet (114.39.16.239), 11/20/2018 19:48:58
文章代碼(AID): #1RytLFAv (Python)
文章代碼(AID): #1RytLFAv (Python)