[問題] crawl http://www.netgear.com/

看板Python作者 (881 forever)時間11年前 (2014/06/25 09:11), 編輯推噓0(003)
留言3則, 2人參與, 最新討論串1/1
問一下各位高手 因為被指定一個task 就是crawl http://www.netgear.com/ 這個網站裡面的相關資訊,就是給一個關鍵字 然後把文章拉出來 因為裡面有一個search bar可以提供搜尋 我的想法是: 先鍵入關鍵字後 再從他的吐出來的結果,在去抓網址然後再下載thread 可是吐出來的結果完全找不到網址 各位大大有什麼好的想法與建議嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.218.124 ※ 文章網址: http://www.ptt.cc/bbs/Python/M.1403658714.A.0EF.html

06/25 10:35, , 1F
因為它的結果是用 AJAX 插入的, 稍微搜尋一下相關資料吧
06/25 10:35, 1F

06/29 12:00, , 2F
麻煩一點,要直接找到他 AJAX 運作的 HTTP method & URL
06/29 12:00, 2F

06/29 12:02, , 3F
或者可能簡單點直接用 Selenium 驅動 browser
06/29 12:02, 3F
文章代碼(AID): #1JgY7Q3l (Python)
文章代碼(AID): #1JgY7Q3l (Python)