PTT數位生活區 / Python

[問題] 網頁爬蟲POST問題

看板Python作者amarco (amarco)時間9年前 (2017/01/26 11:19)推噓2(2推 0噓 3→)

留言5則, 5人參與討論串1/1

大家好最近研究需要，正在寫一個爬蟲抓tripadvisor上面的review資料以此網頁為例： https://www.tripadvisor.com.tw/Hotel_Review-g293913-d306447-Reviews-Grand_Hyatt_Taipei-Taipei.html 但因為點進去時，預設是只有顯示中文的review，但我想要抓取所有語言的reivew，所以要點選所有語言。我看FORM DATA裡面的filterLang會從zhTW變成ALL，所以我試著用POST去讀網頁原始碼，但是結果一直無法成功讀取所有的review。網頁也變成是錯誤。不知道是哪裡出了問題，請大家幫忙看一下。謝謝大家!!!! 程式碼: import requests payload = {'filterLang':'ALL'} res = requests.post('https://www.tripadvisor.com.tw/Hotel_Review-g293913-d306447-Reviews-Grand_Hyatt_Taipei-Taipei.html', data = payload) print (res.text) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 如果用GET，那網頁就只顯示有中文的review。 import requests from bs4 import BeautifulSoup as bs reviews = requests.get('https://www.tripadvisor.com.tw/Hotel_Review-g293913-d306447-Reviews-Grand_Hyatt_Taipei-Taipei.html') soup = bs(reviews.text, "html.parser") for review in soup.select('.reviewSelector'): print (review.select('.noQuotes')[0].text) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 72.182.35.148 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1485400793.A.C56.html

推

01/26 14:38, , 1^F

01/26 14:38, 1^F

→

01/28 08:00, , 2^F

01/28 08:00, 2^F

推

02/08 11:41, , 3^F

02/08 11:41, 3^F

→

02/09 13:55, , 4^F

02/09 13:55, 4^F

→

02/10 00:13, , 5^F

02/10 00:13, 5^F

‣ 返回看板[ Python ] 程設

‣ 更多 amarco 的文章

文章代碼(AID): #1OYMhPnM (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

6月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

8月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

8

10

[賣/桃園/皆可] 芝奇幻光戟 16Gx2 DDR4-3200

[ HardwareSale ]

6小時前, 06/21

5

8

[請益] 顯卡升級請益

[ PC_Shopping ]

7小時前, 06/21

19

44

[新聞] 華碩沒放生用戶！5款手機有望升級Android

10小時前, 06/21

12

39

[情報] 內嵌式藍光ASUS BW-16D1HT似乎停售了

[ PC_Shopping ]

10小時前, 06/21

4

25

[問題] 17續航真有比16 plus長嗎？

12小時前, 06/21

16

108

[請益] 關於mini桌機的推薦！

[ PC_Shopping ]

12小時前, 06/21

3

15

[討論] 請不要叫我測評君榮耀Magic8Pro長期使用

13小時前, 06/21

-3

12

[估價] KLEVV 科賦 CRAS X RGB DDR4 3200 16Gx4

[ HardwareSale ]

19小時前, 06/21

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 amarco 的文章

文章代碼(AID): #1OYMhPnM (Python)