Re: [問題] VBA 抓非固定表單的資料已刪文

看板Programming作者 (Neisseria)時間8年前 (2016/06/26 12:47), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串2/2 (看更多)
如果妳的專業不是資訊相關的,去 soft job 徵人做比較快 只是幫忙抓資料,應該不算寫論文的槍手 如果想自己來的話,提示一下: 因為那個網頁是用 frame 分成數個網頁 可以單獨處理其中一個子頁面,會比較簡單,如下: http://structurednotes-announce.tdcc.com.tw/Snoteanc/apps/bas/BAS210.jsp 然後,觀察一下網頁原始碼 可以發現那個按鈕會引發一段 JavaScript 程式 單純用 HTTP GET/POST 可能無法作用 而要使用 Selenium 這種網頁自動化軟體,模擬操作選單和按鈕的動作 Selenium 有許多種語言的 binding,挑一個喜歡的即可 如果沒有特別的偏好,建議選 Python 的 binding 然後,就要開始自己刻命令稿來自動化得到網頁 寫好命令稿後,可取得網頁原始碼 之後,再用 HTML parser 去取出自己需要的部分 附上一小段範例,僅供參考 https://pastebin.com/PJEyDPCt 小弟只是一時手癢,試玩一下,不是什麼高手 希望板上各位大大不要鞭太大力 3Q ※ 引述《Super16666 (SuperJJ)》之銘言: : 軟體:EXCLE : 版本:2010 : 想問怎樣抓下面的資料,我是在TDCC境外平台 : http://structurednotes-announce.tdcc.com.tw/Snoteanc/ : 因為論文需要,想要一口氣抓下方所有的資料(如下圖),可是這個真的太多了... : http://i.imgur.com/YAdT3ng.png
: 進去網站之後,點左側"商品總覽" : 我想要一口氣把所有"發行人/總代理人"下方的表格都下載下來 : http://i.imgur.com/c1M7BaTg.png
: 可是有兩個困難點 : 1. 第一個就是從EXCEL的時候,如果我直接COPY網址,他只會連到這個首頁... : 這樣子就不能直接抓表格... : 2. 就是他的頁碼介面很不友善,只能一頁一頁點,也要點到最後一頁才知道總共有幾頁 : 而且假設你要到第十頁只能一頁一頁點... : http://i.imgur.com/TmhefhZ.png
: 想問問看有沒有大神可以一口氣下載全部資料... : 救救小妹我的論文QQ : 目前有網友是建議用createobject("internetexplorer.application") : 不過我已經嘗試好久了真的弄不太出來,有人可以稍微指點一下嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.182.128.249 ※ 文章網址: https://www.ptt.cc/bbs/Programming/M.1466916475.A.E54.html

07/05 16:42, , 1F
推(Y)
07/05 16:42, 1F

07/21 13:42, , 2F
這個用python做比較簡單,vba比較難做
07/21 13:42, 2F
文章代碼(AID): #1NRrvxvK (Programming)
文章代碼(AID): #1NRrvxvK (Programming)