看板 [ Google ]
討論串[問題] 明明有那封信卻搜尋不到
共 5 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓3(3推 0噓 0→)留言3則,0人參與, 最新作者SYOTEN (曠工的礦工)時間19年前 (2006/08/03 13:34), 編輯資訊
1
0
0
內容預覽:
我的Gmail裡有一封信. 主題是: 家庭圖書證. 搜尋圖書 可以搜尋得到. 沒想到用圖書證三個字卻搜尋不到. 我還仔細檢查過字有沒有打錯. 甚至直接從那封信的主題上複製這三個字去搜尋. 一樣搜尋不到. 怎麼會這樣?. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 61.56

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者orion (火星上的人類學家)時間19年前 (2006/08/03 14:17), 編輯資訊
0
0
0
內容預覽:
可能要打"家庭圖書證". 最近發現Gmail中文斷字有問題. 好像不是他要的斷字,就搜不到. 所以設條件收信的時候,也會漏掉很多應該符合條件的信. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 220.132.167.239.

推噓4(4推 0噓 0→)留言4則,0人參與, 最新作者Baudelaire (遺憾太常。)時間19年前 (2006/08/04 02:38), 編輯資訊
1
0
0
內容預覽:
技術上的原因是,. 處理中文時,會先把整篇文章indexing下來,. 而如果做decompound的時候沒有考慮到那些詞/UTF-8斷字出問題(這比較不會發生),. 那搜尋的時候當然就找不到了。. ---. 簡單說,中文搜尋是這樣做的:. 如果corpus是「家庭圖書證」,. 我們可以拆成 家 庭
(還有214個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者davidyu (davidyu)時間19年前 (2006/08/04 04:50), 編輯資訊
1
0
0
內容預覽:
實際上怎麼做的我不曉得,不過這麼 domain specific 的東西,用 general purpose 的資料庫去做聽起來就很不合理。(抱歉我不曉得那兩詞中文要怎麼翻比較恰當). --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 216.239.45.4.

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者Baudelaire (遺憾太常。)時間19年前 (2006/08/04 05:46), 編輯資訊
0
0
0
內容預覽:
呃,老實說我不知道Google內部怎麼做,. 不過可能是用自己改寫過的MySQL跟一堆open source做的;. 我是聽同事謠言說Google是用MySQL跟Oracle實做,. 詳細狀況我不知道。. 當然啦,在NLP部份用GDBM/CDB來實做應該也是有的。. ---. 大哥既然是從Googl
首頁
上一頁
1
下一頁
尾頁