PTT數位生活區 / Python

[問題] 該如何靠一個定位點抓取上層資料？

看板Python作者KeyBoardKill (✩鍵✩盤✩戮✩)時間8年前 (2018/06/03 18:38)推噓2(2推 0噓 5→)

留言7則, 3人參與討論串1/1

各位好，做爬蟲又遇到了個問題...基本上來源會有 ID 跟 Number ，我必須靠Number 來追蹤到ID，目前已經能做到追蹤到Number但ID跟Number不同行，我不懂該如何提取能給我點提示嗎？謝謝範例:..... str = ''' <li><a href="123.html" target=_blank class="Observe24"> 十分鐘資料</a></li> ''' 如果是整行同一行我就有辦法使用split來抓到並清洗出我要的123.html 但現在如果分行了，我只能抓到唯一識別值：十分鐘資料，我不知道應該怎麼回推從我在原始碼找到十分鐘的資料後，往上一行獲取到 123.html 這個值懇請指點謝謝 -- ◢ ◣ ● █≡◥◣ ◢ ◣ 】。 \。【這個板需要更高竿的酸民 ● //﹀\\● ◥ ◤ 】 ╰═╯【 ◤ ◢◥ ◤◣ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.158.30.145 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1528022314.A.E65.html

推

06/03 18:56, 8年前 , 1^F

06/03 18:56, 1^F

→

06/03 18:56, 8年前 , 2^F

06/03 18:56, 2^F

→

06/03 18:56, 8年前 , 3^F

06/03 18:56, 3^F

謝謝，但不是撈所有的url，我想要先抓到十分鐘資料後再抓到和它一起的123.hml

推

06/03 19:39, 8年前 , 4^F

06/03 19:39, 4^F

→

06/03 19:39, 8年前 , 5^F

06/03 19:39, 5^F

沒錯...我是以純文字操作，我原以為能自幹功能XD...看來還是要用parse，想說或許能節省點效能XDD 只不過剛用bs4 + lxml後還是會有分行的狀況QQ ※ 編輯: KeyBoardKill (49.158.30.145), 06/03/2018 20:22:49

→

06/03 23:09, 8年前 , 6^F

06/03 23:09, 6^F

→

06/03 23:20, 8年前 , 7^F

06/03 23:20, 7^F

‣ 返回看板[ Python ] 程設

‣ 更多 KeyBoardKill 的文章

文章代碼(AID): #1R4yKgvb (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

10

20

[情報] AMD 發表*新*的 Zen2 / Zen2+ CPU

[ PC_Shopping ]

2小時前, 06/17

5

15

[菜單] 300K 遊戲AI機

[ PC_Shopping ]

4小時前, 06/17

2

13

[菜單] 60K遊戲主機

[ PC_Shopping ]

4小時前, 06/16

11

22

Re: [情報] KIOXIA 2TB TLC SSD 電腦家特價

[ PC_Shopping ]

5小時前, 06/16

20

50

[菜單] 200K 遊戲娛樂機

[ PC_Shopping ]

7小時前, 06/16

38

107

[心得] 三星品質是不是已經不行了？

8小時前, 06/16

7

13

[購機] 外送專用手機 realme 15t oppo a6s

8小時前, 06/16

7

38

[請益] 移動式鍵盤架滑鼠架

[ PC_Shopping ]

8小時前, 06/16

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 KeyBoardKill 的文章

文章代碼(AID): #1R4yKgvb (Python)