PTT數位生活區 / Python

[問題] 抓取留言

看板Python作者s1021412107 (阿宗)時間7年前 (2018/08/27 13:33)推噓2(2推 0噓 7→)

留言9則, 4人參與討論串1/1

請問各位大大小弟剛學爬蟲想要抓取ptt裡的留言但是我看網路只能抓留言的內容推文、ID名稱、內容、時間怎麼同時抓下來想要直接分類好推文還是噓文 Code如下： import requests from bs4 import BeautifulSoup #所要擷取的網站網址 url = 'https://www.ptt.cc/bbs/movie/M.1535264750.A.3E3.html' #建立回應 response = requests.get(url) #印出網站原始碼 #print(response.text) #將原始碼做整理 soup = BeautifulSoup(response.text, 'lxml') #使用find_all()找尋特定目標 articles = soup.find_all('div', 'push') #寫入檔案中 with open('movie_message.txt','w') as f: for article in articles: #去除掉冒號和左右的空白 messages = article.find('span','f3 push-content').getText().replace(': ','').strip() print(messages) f.write(messages + "\n") https://i.imgur.com/dcD1cdz.jpg

https://i.imgur.com/qOreC31.jpg

https://i.imgur.com/cv3ixcj.jpg

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.26.37.2 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1535348036.A.483.html

→

08/27 16:38, 7年前 , 1^F

08/27 16:38, 1^F

→

08/27 16:40, 7年前 , 2^F

08/27 16:40, 2^F

→

08/27 20:01, 7年前 , 3^F

08/27 20:01, 3^F

→

08/27 20:05, 7年前 , 4^F

08/27 20:05, 4^F

→

08/27 20:05, 7年前 , 5^F

08/27 20:05, 5^F

推

08/28 00:37, 7年前 , 6^F

08/28 00:37, 6^F

→

08/28 00:39, 7年前 , 7^F

08/28 00:39, 7^F

推

09/05 12:18, 7年前 , 8^F

09/05 12:18, 8^F

→

09/05 12:19, 7年前 , 9^F

09/05 12:19, 9^F

‣ 返回看板[ Python ] 程設

‣ 更多 s1021412107 的文章

文章代碼(AID): #1RWur4I3 (Python)

Python 近期熱門文章

3

13

[問題] vscode的debug模式不用考慮中文路徑

1周前, 02/01

1

1

[問題] python 3.14 free thread build

3月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

3月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

4月前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

6月前, 07/19

15

23

[閒聊] 各位現在用os.path 還是用pathlib.Path

6月前, 07/17

6

11

[閒聊] 2024年的自我python學習

6月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

10月前, 04/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

10

11

[心得] Audeze LCD-5S 超隨便開箱

11小時前, 02/10

4

8

[情報] 115年中華電信抽抽樂, 2/11開賣

11小時前, 02/10

11

60

[新聞] 蘋果新品連環秀平價iPhone快來了

11小時前, 02/10

23

112

[請益] 北部哪邊有賣日本配置鍵盤？

[ PC_Shopping ]

12小時前, 02/10

3

6

[賣/嘉義/面交] 全新三星S25U 保固2年

[ mobilesales ]

12小時前, 02/10

9

19

[閒聊] 請問南亞顆粒的體質如何？

[ PC_Shopping ]

12小時前, 02/10

43

163

[情報] Intel新一代傳奇耐電王NVL K版超過700瓦

[ PC_Shopping ]

12小時前, 02/10

15

44

[情報] 機車店14700/H610/16G/1TB $21599

[ PC_Shopping ]

13小時前, 02/10

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 s1021412107 的文章

文章代碼(AID): #1RWur4I3 (Python)