[請益] 給一段文字,分析 yahoo/google 關鍵字

看板PHP作者 (Bulwark)時間13年前 (2012/03/19 01:05), 編輯推噓0(004)
留言4則, 4人參與, 最新討論串1/1
各位好, 最近看到一個 php 寫的網頁,可以做到中文分詞功能, 似乎是透過比對 yahoo 的關鍵字? 網址是:http://2.oni.tw/2011/07/blog-post_25.html 點選 ycas.php 的連結,輸入文字, 例如輸入「海綿寶寶說他喜歡打棒球耶」 他就會分析出「海綿寶寶,打棒球,海綿,寶寶,喜歡」 這些關鍵字。 因為自己做的分詞系統,通常無法解析出「海綿寶寶」 而會拆成「海綿」和「寶寶」兩個關鍵字, 但是透過搜尋引擎的話「海綿寶寶」 這個關鍵字就能被拆解出來。 請問有沒有朋友知道其中奧妙?到底是怎麼做到的。 感謝~ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.193.4.113

03/19 04:02, , 1F
長字串優先拆啊@_@?
03/19 04:02, 1F

03/19 08:45, , 2F
03/19 08:45, 2F

03/19 13:04, , 3F
db這邊以字串數字大先排列,server以db資料作分解…
03/19 13:04, 3F

03/19 23:26, , 4F
原來 yahoo 有「斷章取義」這種 api :)
03/19 23:26, 4F
文章代碼(AID): #1FPXN43I (PHP)
文章代碼(AID): #1FPXN43I (PHP)