Re: [趣聞] Google勝華佗 診病超準確

看板Google (谷歌Google)作者 (.................)時間18年前 (2006/11/24 12:50), 編輯推噓3(301)
留言4則, 3人參與, 最新討論串4/5 (看更多)
※ 引述《wasabicat (貓科動物)》之銘言: : ※ 引述《thxmotor (天天都有好狗運)》之銘言: : : Google勝華佗 診病超準確 : : 中時電子報 更新日期:2006/11/11 04:09 記者: 潘勛/綜合報導 : : 舉例來說,有個四十八歲男病患有「多重脊椎腫瘤」與「皮膚腫瘤」,兩位醫師輸入這兩 : : 個詞彙,古鉤便回答,病人可能罹患「第一型神經線纖維瘤」,答案正確無誤。 : : 另一個病例中,有名男子慢跑時失去意識;輸入「心跳遽停」、「運動」及「年輕」這三 : : 個詞彙,古鉤則回答病名是「阻塞性肥厚心肌症」,也答對了。其他診斷成功的病例還有 : : 庫賈氏症、胃腸出血、肌萎縮、腦炎等。 : : http://w114.news.tpc.yahoo.com/article/url/d/a/061110/4/6dot.html : 這篇看推文的網友好多喔 : 可以問一下到底是該怎麼查詢嗎? : 是直接到google上面,輸入上面病症的正確英文學名就可以查到了嗎? : 還是有什麼特殊的網頁是用來查這個的 : 謝謝大家啦~~~ 應該就是把症狀描述當做keyword,google會找出一堆相關疾病的網頁, keyword下得好的話,出來的資訊還蠻有用的。 又,google的搜尋引擎真是越做越好。 之前去聽了Peter Norvig的演講, 講了google在搜尋、natural language processing(NLP)、 computational linguistics(CL)上的發展, 還真是令人印象深刻。 (先說,我不是做NLP、CL的人,或許這些領堿的人會有不同的意見) 他們用了蠻多AI、learning的東西來加強本身的技術。 最值得稱道的就是他們的training database, 畢竟是玩搜尋引擎的,他們擁有的training database大的嚇人, 相比之下,其它研究人員的training dataset看起來有點像玩具。 (again,我不是做NLP、CL的人,或許實情並不是如此) 就因為database很大,所以他們發展的方法也都是data-driven。 譬如說,他們讓電腦自己去learn各辭彙間的relation,語言、句子的pattern。 舉例而言,假如你在google上打population japan, 第一項就是直接告訴你日本的人口有多少(電腦直接去網路上幫你找出解答)。 當然有很多別的網站也是做的到這功能, 不過很多是靠定義regular expression、定義population是japan的一個屬性, 然後再去各網頁中尋找這個pattern,進而找到解答。 而google的作法則是讓電腦自己去learn這個pattern、 發現population是japan的一個屬性。 另外像google也在做statistical machine translation(MT), 用的也是learning based、data driven的方法, 就是讓電腦自己去learn各語言間的對應關係。 google在NIST的Arabic-English跟Chinese-Englis的MT evaluation中名列前矛, 據說他們的team裡面還沒有chinese跟arabic的linguistic expert!? (後面這點不是Peter說的,是我聽別人講的,有可能是謠言:p) 對了,Peter還提到了他對搜尋引擎的想法, 大部分的人應該都認為搜尋引擎是單向的互動, 就是由內容提供者提供網頁->google分析、整理這些網頁 ->最後在使用者查詢時給出結果。 不過Peter認為搜尋引擎應該是雙向的溝通, 因為一般的網頁中,絕大多數的東西都是垃圾,只有少數的內容才有意義, 因此只用網頁來learning,實在是問題多多(譬如說noise太多)。 但使用者所下的keyword不同,絕大多數的keyword簡短、有意義, 因此更適合用來整理、歸納各種資訊,幫助電腦來learn各種語言、辭彙上的關係。 (譬如說如果你想知道bush幾歲,絕大多數的人應該是下age bush當關鍵字, 而不是啥how old is bush之類的, 從這個query就可以知道而age和bush有關係:age是bush的屬性之一) 簡而言之,當你每次在google下關鍵字找東西時, 也算是間接的幫助了他們改善整個搜尋的效能。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.30.73

11/24 17:53, , 1F
很棒的分享:)
11/24 17:53, 1F

11/25 10:54, , 2F
中研院的簡立峰就是作中文資料檢索的專家,他目前在
11/25 10:54, 2F

11/25 10:56, , 3F
google
11/25 10:56, 3F

11/25 23:50, , 4F
這篇文章有1000銀 orz...
11/25 23:50, 4F
文章代碼(AID): #15PdeRJf (Google)
文章代碼(AID): #15PdeRJf (Google)