Re: [問題] 網路爬蟲相關問題

看板R_Language作者 (幻想天空)時間8年前 (2017/06/07 13:44), 8年前編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
※ 引述《tses89214 (幻想天空)》之銘言: : [問題類型]: : : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : [軟體熟悉度]: : 入門(寫過其他程式,只是對語法不熟悉) : [問題敘述]: : 各位好,我想要抓取旅遊網站上面的金額的資訊,就是橘色的NT$的部分 : https://goo.gl/rTUzDp (網址過長所以縮了一下) : 但因為沒有處理過動態的網站而卡關, : 目前進度是使用read_html以及readLines這兩個function試過, : 發現抓到東西的與看到的網頁原始碼不一樣。 : 從開發者工具雖然有看到幾個.js的項目, : 卻不太知道該用GET或是POST什麼東西給他們, : 所以想問:該用什麼方法才能得到想要的資料呢? : 謝謝! : PS.只要能拿到網頁的原始碼就行了,後面的文字處理我可以自己來。 : [關鍵字]: : : 網路爬蟲 : 抱歉又有新的問題了QQ, 目前進度是想要爬在各種行程裡面,不同票種(成人,小孩,老人等)的票價, 從開發者工具看到它是在選定套餐與時間之後,對一串網址傳送訊息得到資料, 以同一個行程當例子(https://goo.gl/rTUzDp),範例網址如下: https://www.klook.com/xos_api/rest/arrangements_api/3547822.json?gateway=web&_=1496809592949 但我搞不懂的是,他的"...api/3547822.json"這段, 那串數字是怎麼得到的? 不同的套餐、時間,那串數字就會不一樣, 想說如果能知道規律就能得到回傳的資訊了, 抑或者有其他的方法可以得到不同行程中的不同票種的票價嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.119.176.235 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1496814281.A.64F.html ※ 編輯: tses89214 (140.119.176.235), 06/07/2017 13:45:47
文章代碼(AID): #1PDvB9PF (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1PDvB9PF (R_Language)