PTT數位生活區 / RegExp (正規表示式 Regular Expression)

[問題] 網頁資料抓取

看板RegExp (正規表示式 Regular Expression)作者filiaslayers (司馬雲)時間12年前 (2014/03/03 15:18)推噓0(0推 0噓 9→)

留言9則, 2人參與討論串1/1

/* 聽說註明使用的語言、環境 * 問題有可能較容易被解決... */ 我寫了一個script想要抓取一個網頁上的檔案列表這個網頁是用apache做index，也就是會把目錄下的檔案自動生成一個列表我有上網google到一個方法，不過他寫的我實在看不懂... 有人可以教我怎麼分析嗎? wget --spider --recursive --no-verbose --output-file=wgetlog.txt $url sed -n "s@.\+ URL:\([^ ]\+\) .\+@\1@p" wgetlog.txt | sed "s@&@\&@" 第一行我知道，不過第二行就不看太懂了而且linux下的sed不是應該要用'而不是"嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.135.113.202

→

03/03 19:23, , 1^F

03/03 19:23, 1^F

→

03/03 19:23, , 2^F

03/03 19:23, 2^F

→

03/03 21:04, , 3^F

03/03 21:04, 3^F

→

03/03 21:44, , 4^F

03/03 21:44, 4^F

→

03/03 21:44, , 5^F

03/03 21:44, 5^F

→

03/03 21:47, , 6^F

03/03 21:47, 6^F

→

03/03 21:47, , 7^F

03/03 21:47, 7^F

→

03/03 21:48, , 8^F

03/03 21:48, 8^F

→

03/03 21:48, , 9^F

03/03 21:48, 9^F

懂了，非常謝謝你還可以再請問一下，裡面的@是什麼用意嗎? ※ 編輯: filiaslayers 來自: 1.34.109.207 (03/04 08:02)

‣ 返回看板[ RegExp ] 程設

‣ 更多 filiaslayers 的文章

文章代碼(AID): #1J52oers (RegExp)

RegExp 近期熱門文章

1

3

Re: [請問] regexp的replace？

1年前, 04/07

2

9

[閒聊] 原來正規表示法可以用來找質數

3年前, 09/26

2

9

[問題] 有沒有辦法用 Regex 檢查對話框？

4年前, 11/26

2

10

[問題] Atomic Group 的原理是什麼?

4年前, 11/15

4

14

[問題] 怎抓到全部的()

4年前, 10/09

8

15

[問題] 取代引號中的特定字串

4年前, 10/06

1

5

[問題] 網頁元素問題

5年前, 11/25

4

12

[問題] 請問一題正則表達式

5年前, 11/08

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

9

30

[請益] 等等黨崩潰，拿到 RTX 5080 後，電腦壞掉

[ PC_Shopping ]

32分鐘前, 08/02

4

18

[新聞] Google Pixel 11 全系列規格曝光：四款新

53分鐘前, 08/02

19

49

[情報] 微軟:我們承認Win11的RAM最佳化太爛

[ PC_Shopping ]

5小時前, 08/02

3

10

[徵/台北/面交] 9070XT

[ HardwareSale ]

10小時前, 08/02

13

44

[心得] 購買Fold 8的試用評估

11小時前, 08/01

4

11

[菜單] 80K白色遊戲機

[ PC_Shopping ]

11小時前, 08/01

5

8

[賣/全國/寄送] Steam Controller

[ HardwareSale ]

12小時前, 08/01

6

10

Fold 8 酷澎買其實還蠻優惠的耶

14小時前, 08/01

更多即時熱門文章 >>

‣ 返回看板[ RegExp ] 程設

‣ 更多 filiaslayers 的文章

文章代碼(AID): #1J52oers (RegExp)