[問題] 爬蟲 期貨表格
code
https://pastebin.com/7nj8i6RD
如下:
import requests
import sys
import re
from bs4 import BeautifulSoup
import pandas
import lxml
Juridical_person = "http://www.taifex.com.tw/cht/3/futContractsDateExcel"
df = pandas.read_html(Juridical_person)
print(df[1])
pandas讀進來之後,print出來發現表格歪掉了
可能是前兩欄有些儲存格合併的關係
我該怎麼呈現和網頁一樣的效果呢?
我應該在讀進來之前就先對html作處理
還是讀進來之後再對df作表格的排版
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.39.16.239
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1542681935.A.2B9.html
→
11/20 16:13,
6年前
, 1F
11/20 16:13, 1F
感謝回覆
我相信不論pandas讀進來之前還是之後作處理應該都能解決
礙於新手對語法不熟,兩種方法都不知該如何具體的寫出code
經過下午在網上翻閱文章終於解決,在此使用的方法為後者
將print(df[1])那一行
改為下列兩行
df[1][13:15] = df[1][13:15].shift(2,None,'columns')
print(df[1].loc[12:14,9:14])
程式碼如下
https://pastecode.xyz/view/157bc1ba
※ 編輯: WhiteComet (114.39.16.239), 11/20/2018 19:48:58
Python 近期熱門文章
PTT數位生活區 即時熱門文章