[問題] google search 爬蟲
我只想在對google search 爬取文章
例如 icecream@gmail.com 有多少業者
https://imgur.com/a/kLSId6D
會對結果收集並存放到excel
一筆資料會有五個欄位
1.網域
2.完整網域
3.主標題
4.內文
5.圖片網址
對我發現一個問題
每個物件用BS4的class都是隨機亂碼,
造成不保證後續都可以用同個class去抓
我自己用了幾次 目前都是同個物件class(亂碼)沒變
但我覺得可能過幾天就會更換
Q1.請問google search 結果的html class似乎都是亂碼取名該怎應對?
Q2.class=VwiC3b yXK7lf lVm3ye r025kc hJNv6b Hdw6tb
這怎class該怎抓阿 名稱太長且中間有空格,一直抓失敗..
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 218.172.36.32 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1706914727.A.11D.html
※ 編輯: jackjenny (218.172.36.32 臺灣), 02/03/2024 08:44:03
推
02/03 14:17,
10月前
, 1F
02/03 14:17, 1F
→
02/03 14:17,
10月前
, 2F
02/03 14:17, 2F
推
02/04 02:02,
10月前
, 3F
02/04 02:02, 3F
→
02/04 03:45,
10月前
, 4F
02/04 03:45, 4F
→
02/10 21:52,
10月前
, 5F
02/10 21:52, 5F
Python 近期熱門文章
PTT數位生活區 即時熱門文章