Re: [問題] Google的搜尋結果筆數,哪個才正確?
: 學語文時,有時會利用google搜尋來查詢不同片語的使用頻率,來了解哪種最常被使用,
: 可是今天發現一個小問題:
: 如果我查詢
: "what i'm surprised about is" -- 第一頁搜尋結果顯示 2980
: "what i'm surprised at is" -- 第一頁搜尋結果顯示 7210
: 可是如果不斷地往後點選結果,一直到最後一個,會發現筆數變了:
: "what i'm surprised about is" -- 467
: "what i'm surprised at is" -- 262
google是同時把query送到很多個server,
才有可能250ms內搜尋幾億筆的資料, 回傳的數量只是個大概值,
一直按下一頁後, 實際的筆數就可能會不一樣
想知道那個最常被使用, 只需要相對數值, 不需要絕對數值
另外, 還有很多的網頁, 沒有被crawl到, 或是被crawl到,
但是品質太低而沒有被索引, 所以不用太在意那個絕對數值的
: (而且這樣又有另外一個問題,就是當搜尋結果筆數過多時,似乎只能點到第91頁,
是的 (我印象中是100頁?), 可以直接改url的參數試試看
: 就無法再繼續往後點了...)
你可以找個會寫程式的, 用google api去拿到所有你想知道的片語
在google搜尋的個數
--
如果在世界上的頹廢,
可以換來對自己的負責,
那我寧願對自己負責....
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.166.100.94
推
06/12 01:15, , 1F
06/12 01:15, 1F
→
06/12 01:16, , 2F
06/12 01:16, 2F
推
06/12 02:43, , 3F
06/12 02:43, 3F
→
06/12 02:44, , 4F
06/12 02:44, 4F
→
06/12 02:45, , 5F
06/12 02:45, 5F
→
06/12 02:46, , 6F
06/12 02:46, 6F
→
06/12 02:47, , 7F
06/12 02:47, 7F
推
06/12 04:41, , 8F
06/12 04:41, 8F
→
06/12 04:43, , 9F
06/12 04:43, 9F
→
06/12 04:44, , 10F
06/12 04:44, 10F
→
06/12 04:45, , 11F
06/12 04:45, 11F
→
06/12 04:47, , 12F
06/12 04:47, 12F
→
06/12 04:48, , 13F
06/12 04:48, 13F
推
06/12 13:49, , 14F
06/12 13:49, 14F
→
06/12 15:18, , 15F
06/12 15:18, 15F
→
06/12 15:19, , 16F
06/12 15:19, 16F
→
06/12 15:20, , 17F
06/12 15:20, 17F
→
06/12 15:20, , 18F
06/12 15:20, 18F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
Google 近期熱門文章
PTT數位生活區 即時熱門文章