看板
[ Google ]
討論串[問題] 請問 tag 和斷字的問題?
共 4 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
不知道適不適合在此發問,不適合將自刪. -------------------------------------. 1. Blog, 網摘(社會書籤),Flickr...etc.. 都有提供 tag(標籤)的功能,通常每個標籤間以空一格來區分,. 如果是外國人名呢? Ex:Mariah Carey
(還有219個字)
內容預覽:
相關度當然跟字與字之間的距離有關;. 有興趣可以找看看 tf-idf、information theory的論文來看。. 比如說 I went to Yankee Stadium, where the baseball history lives.這句話,. baseball 跟Yankee的關係強
(還有267個字)
內容預覽:
中文斷詞 Word Segmentation 用google找應該很多才對.... 問題很簡單 舉個例子. "土地公有政策" 可能會被斷成. 1. 土地 公有 政策. 2. 土地公 有 政策. 到底哪種斷詞的方法是對使用者有意義的呢?這就是斷詞的研究囉。. 解決之道,一般最簡單的是用2-gram i
(還有78個字)
內容預覽:
2-gram的衍生當然就是n-gram,看用多少字做indexing,. 這是業界比較常用的方法;. 機率模型在NLP裡最常用的大概還是HMM,. Hidden Markov Model,然後用大量的corpus去train你的model,. 因為不同的文章,比如新聞報導或者blog,所使用的字詞不
(還有289個字)
首頁
上一頁
1
下一頁
尾頁