[詢問] 試算表IMPORTXML的xpath_query用法

看板Google (谷歌Google)作者 (屁毛)時間8年前 (2016/12/18 11:34), 編輯推噓2(207)
留言9則, 4人參與, 最新討論串1/1
hi 大家好, 小弟目前想用google試算表自動抓取網頁的某個特定欄位 看起來IMPORTXML(url, xpath_query)可以符合我的需求 但卡在xpath_query這參數怎麼用都不順 舉例來說 我要抓網頁: https://statementdog.com/analysis/tpe/2324#2324 的最新3年平均現金股息殖利率: 6.78 下的參數是 url: https://statementdog.com/analysis/tpe/2324#2324 xpath_query: //*[@id='dataTable']/table/tbody/tr[3]/td[72] 這會導致匯入內文空白的error 說明一下上述的xpath_query是來自於: 1. 使用chrome瀏覽器開啟該網頁 2. 把6.78框起來點右鍵 => 按檢查 3. 把反藍的那一行語法點右鍵 => copy => copy xpath 4. 得到//*[@id="dataTable"]/table/tbody/tr[3]/td[72] 5. 把上述xpath中的雙引號改成單引號 得到//*[@id='dataTable']/table/tbody/tr[3]/td[72] 6. 使用chrome套件xpath helper驗證5.的xpath的確可以取得6.78這個值 所以看起來這個xpath是對的 想請版上高手解惑以下問題 1. 為何輸入到試算表後會得到"匯入內文空白"的error? 2. 如何解決問題1? 3. 使用試算表,是否有更簡易快速的作法能做到這件事? 先行謝過! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.232.81 ※ 文章網址: https://www.ptt.cc/bbs/Google/M.1482032098.A.83A.html

12/19 11:20, , 1F
因為這網頁是動態網頁...
12/19 11:20, 1F

12/19 11:20, , 2F
而且資料是 js 去撈的
12/19 11:20, 2F

12/19 11:21, , 3F
Google 試算表應該不會去執行 js
12/19 11:21, 3F

12/19 11:25, , 4F
Google 那個應該只能抓 ctrl + u 看原始碼有的資料
12/19 11:25, 4F

12/19 19:04, , 5F
這幾天也在弄這個…你只要把『//*[@id="dataTable"]』括號
12/19 19:04, 5F

12/19 19:04, , 6F
內的刪除應該就可以了
12/19 19:04, 6F

12/19 20:58, , 7F
樓上大哥,我用/table/tbody/tr[3]/td[72]也不行...
12/19 20:58, 7F

12/20 09:34, , 8F
那就只能換個網站查詢了
12/20 09:34, 8F

08/08 01:32, , 9F
把tbody拿掉試試
08/08 01:32, 9F
文章代碼(AID): #1OLWFYWw (Google)
文章代碼(AID): #1OLWFYWw (Google)