Re: [問題] Google的搜尋結果筆數,哪個才正確?

看板Google (谷歌Google)作者 (喵)時間17年前 (2009/06/12 00:13), 編輯推噓4(4014)
留言18則, 4人參與, 最新討論串2/2 (看更多)
: 學語文時,有時會利用google搜尋來查詢不同片語的使用頻率,來了解哪種最常被使用, : 可是今天發現一個小問題: : 如果我查詢 : "what i'm surprised about is" -- 第一頁搜尋結果顯示 2980 : "what i'm surprised at is" -- 第一頁搜尋結果顯示 7210 : 可是如果不斷地往後點選結果,一直到最後一個,會發現筆數變了: : "what i'm surprised about is" -- 467 : "what i'm surprised at is" -- 262 google是同時把query送到很多個server, 才有可能250ms內搜尋幾億筆的資料, 回傳的數量只是個大概值, 一直按下一頁後, 實際的筆數就可能會不一樣 想知道那個最常被使用, 只需要相對數值, 不需要絕對數值 另外, 還有很多的網頁, 沒有被crawl到, 或是被crawl到, 但是品質太低而沒有被索引, 所以不用太在意那個絕對數值的 : (而且這樣又有另外一個問題,就是當搜尋結果筆數過多時,似乎只能點到第91頁, 是的 (我印象中是100頁?), 可以直接改url的參數試試看 : 就無法再繼續往後點了...) 你可以找個會寫程式的, 用google api去拿到所有你想知道的片語 在google搜尋的個數 -- 如果在世界上的頹廢,    可以換來對自己的負責,      那我寧願對自己負責.... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.166.100.94

06/12 01:15, , 1F
因為下一頁是下一次搜尋後的結果
06/12 01:15, 1F

06/12 01:16, , 2F
尤其像GOOGLE更新又很快 當然跟你上一次搜尋的結果不一樣
06/12 01:16, 2F

06/12 02:43, , 3F
嗯,我的確不需要精確的數值,可是問題是,若看一下我文章內
06/12 02:43, 3F

06/12 02:44, , 4F
的數字,會發現兩種結果的筆數多寡剛好相反... 囧
06/12 02:44, 4F

06/12 02:45, , 5F
這樣一來,就沒辦法去比較實際上哪種片語較常用了..
06/12 02:45, 5F

06/12 02:46, , 6F
請問你說的google api的方法,會不會有點麻煩?不好意思太麻
06/12 02:46, 6F

06/12 02:47, , 7F
煩人家~
06/12 02:47, 7F

06/12 04:41, , 8F
我想你這樣做只是算取樣而已,而且如果兩者數字相差不大的話
06/12 04:41, 8F

06/12 04:43, , 9F
應該也不太能代表什麼,或是應該是說準確度不見得高,像我剛
06/12 04:43, 9F

06/12 04:44, , 10F
才以你的例子去搜尋,第一次搜尋結果變相反了,用 about 的有
06/12 04:44, 10F

06/12 04:45, , 11F
2000 個,但用 at 的只有 1840 個;但我會覺得兩個數字相差不
06/12 04:45, 11F

06/12 04:47, , 12F
多,參考意義不大,就我的感覺,至少也要差個 10^2 也就是
06/12 04:47, 12F

06/12 04:48, , 13F
100 倍才有參考價值。
06/12 04:48, 13F

06/12 13:49, , 14F
用 google trend?
06/12 13:49, 14F

06/12 15:18, , 15F
謝謝j大的意見,無論如何,我還是希望可以找到方法,
06/12 15:18, 15F

06/12 15:19, , 16F
畢竟往後還是會有需要查詢片語,並且比較搜尋結果筆數的時候
06/12 15:19, 16F

06/12 15:20, , 17F
L大,我查了一下google trend,這個好像是統計"被搜尋次數"
06/12 15:20, 17F

06/12 15:20, , 18F
而非"搜尋結果的筆數"
06/12 15:20, 18F
文章代碼(AID): #1ACIqQDJ (Google)
文章代碼(AID): #1ACIqQDJ (Google)