PTT數位生活區 / FreeBSD

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

看板FreeBSD作者Mild7.時間21年前 (2005/01/08 09:32)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串2/10 (看更多)

==> 在 epstudio.bbs@alway.twbbs.org (蛋餅) 的文章中提到: > 一般來說都是設定 robots.txt 即可～ > 但是要放在哪裡才能真正作用？ > Apache 裡的 Document Root 指定的位置就好... > 還是說連 Visual Host 的每個路徑都要？ > 而且發現， robots.txt 對大陸的 baidu（百度: http://www.baidu.com/）無效～ > 但是 baidu 抓取的資料量又是最多的（死大陸仔）～ > 有沒有辦法可以阻擋？你可以參考 http://www.w3.org http://www.w3.org/robots.txt robots.txt 的語法："<field>:<optionalspace><value><optionalspace>" User-agent: 是用來描述 Spider (Agent) 的名稱，你可以用 * 代表全部 Disallow: 用來設定目錄，你可以用 / 代表全部因此： User-agent: * Disallow: / 這兩行可以禁止所有的 Agent 不過，有些 Agent/Spider 是可以不遵循 robots.txt 附上常見 Robots 的名稱 Googlebot http://www.google.com/ Slurp http://www.inktomi.com/ MSNBOT http://search.msn.com/ Scooter http://www.altavista.com/ FAST-WebCrawler http://www.alltheweb.com/ ia_archiver http://www.alexa.com/ Baiduspider http://www.baidu.com/ - 交大資科 BSD/Chinese/Chinfost/Coffee/Database/Destiny/Economics/FoodStuff GreenEarth/MB/Mobile-comm/Multimedia/PDA/Radio/Security/Tea/Wine/X-files 板主莊昭雄 (Richard Chuang) IEEE Standard, Associate：RichardChuang@IEEE.ORG >>>>> O, God, the sea is so great and my boat is so small <<<<< -- * Post by Mild7 from telnet.hinet.net * Origin: ★ 交通大學資訊科學系 BBS ★ <bbs.cis.nctu.edu.tw: 140.113.23.3>

‣ 返回看板[ FreeBSD ] BSD

‣ 更多 Mild7. 的文章

文章代碼(AID): #11tpWH00 (FreeBSD)

討論串 (同標題文章)

完整討論串 (本文為第 2 之 10 篇)：

排序：最新先 | 最舊先 | 留言數

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/09

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/09

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/09

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/09

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/08

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/08

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/08

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/08

Re: 如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/08

如何阻擋搜尋網站用 robot 抓取網頁～

21年前, 01/08

在新視窗開啟完整討論串 (共10篇)

FreeBSD 近期熱門文章

2

2

[心得] ZFS 因為多版升級而空間不足的解決方案

1月前, 10/07

2

2

[情報] FreeBSD 14.3-RELEASE Announcement

5月前, 06/11

1

2

[情報] FreeBSD 13.5-RELEASE Release Notes

7月前, 04/17

3

3

Re: [問題] 請推薦中文書

1年前, 02/16

1

3

[情報] FreeBSD 14.0-RELEASE Now Available

2年前, 11/30

2

6

[情報] FreeBSD 13.2-RELEASE Now Available

2年前, 05/14

2

9

[問題] truenas jail時間設定

2年前, 12/16

2

2

[閒聊] 最近的 FreeBSD-SA-21:11.smap

4年前, 05/29

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

10

12

[情報] iQOO 15 PC家價格

21分鐘前, 11/28

4

14

[情報] POCO F8 Ultra 首購優惠

42分鐘前, 11/28

4

11

[情報] NVIDIA 84GB 的 RTX Pro 6000D 次旗艦

[ PC_Shopping ]

3小時前, 11/28

10

19

[情報] INTEL Q4 通路促銷 (毀滅式爆料) Z+板

[ PC_Shopping ]

3小時前, 11/28

7

21

[情報] 美光2025新版micron CrucialPRO CL32上市

[ PC_Shopping ]

3小時前, 11/28

2

7

[徵/雙北/面交] S25U Ultra 512G 淺色佳

[ mobilesales ]

3小時前, 11/28

2

6

[情報] S22U收到one ui 8通知

6小時前, 11/28

4

11

[徵/全國/皆可] 徵i7-4790

[ HardwareSale ]

10小時前, 11/28

更多即時熱門文章 >>

‣ 返回看板[ FreeBSD ] BSD

‣ 更多 Mild7. 的文章

文章代碼(AID): #11tpWH00 (FreeBSD)