Re: [問題] VBA 抓非固定表單的資料已刪文
如果妳的專業不是資訊相關的,去 soft job 徵人做比較快
只是幫忙抓資料,應該不算寫論文的槍手
如果想自己來的話,提示一下:
因為那個網頁是用 frame 分成數個網頁
可以單獨處理其中一個子頁面,會比較簡單,如下:
http://structurednotes-announce.tdcc.com.tw/Snoteanc/apps/bas/BAS210.jsp
然後,觀察一下網頁原始碼
可以發現那個按鈕會引發一段 JavaScript 程式
單純用 HTTP GET/POST 可能無法作用
而要使用 Selenium 這種網頁自動化軟體,模擬操作選單和按鈕的動作
Selenium 有許多種語言的 binding,挑一個喜歡的即可
如果沒有特別的偏好,建議選 Python 的 binding
然後,就要開始自己刻命令稿來自動化得到網頁
寫好命令稿後,可取得網頁原始碼
之後,再用 HTML parser 去取出自己需要的部分
附上一小段範例,僅供參考
https://pastebin.com/PJEyDPCt
小弟只是一時手癢,試玩一下,不是什麼高手
希望板上各位大大不要鞭太大力 3Q
※ 引述《Super16666 (SuperJJ)》之銘言:
: 軟體:EXCLE
: 版本:2010
: 想問怎樣抓下面的資料,我是在TDCC境外平台
: http://structurednotes-announce.tdcc.com.tw/Snoteanc/
: 因為論文需要,想要一口氣抓下方所有的資料(如下圖),可是這個真的太多了...
: http://i.imgur.com/YAdT3ng.png
: 進去網站之後,點左側"商品總覽"
: 我想要一口氣把所有"發行人/總代理人"下方的表格都下載下來
: http://i.imgur.com/c1M7BaTg.png
: 可是有兩個困難點
: 1. 第一個就是從EXCEL的時候,如果我直接COPY網址,他只會連到這個首頁...
: 這樣子就不能直接抓表格...
: 2. 就是他的頁碼介面很不友善,只能一頁一頁點,也要點到最後一頁才知道總共有幾頁
: 而且假設你要到第十頁只能一頁一頁點...
: http://i.imgur.com/TmhefhZ.png
: 想問問看有沒有大神可以一口氣下載全部資料...
: 救救小妹我的論文QQ
: 目前有網友是建議用createobject("internetexplorer.application")
: 不過我已經嘗試好久了真的弄不太出來,有人可以稍微指點一下嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.128.249
※ 文章網址: https://www.ptt.cc/bbs/Programming/M.1466916475.A.E54.html
推
07/05 16:42, , 1F
07/05 16:42, 1F
推
07/21 13:42, , 2F
07/21 13:42, 2F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
Programming 近期熱門文章
PTT數位生活區 即時熱門文章