Re: [問題] 正規表達式 有好方法表達 非數字的字母嗎已刪文
※ 引述《JackBaska (Baska)》之銘言:
: 順便問一下,有沒有人知道python有沒有辦法處理模糊查詢跟同意
: 同音的功能 ? 或是有沒有人在github上看過有人分享的 ? 還是要
: 自己刻 ?
如果是要找意義相關的,可以看 semantic similarity
基本的想法是,用已知的字彙庫,找出兩個字之間的關連性,求距離
常見的字彙庫有 WordNet 或 Cyc 等等
如果想看更多內容,可上維基百科,或是看以下這篇
Description and Evaluation of Semantic Similarity Measures Approaches
http://arxiv.org/pdf/1310.8059.pdf (免費 PDF)
要做 semantic similarity,通常不建議自已土炮字彙庫
因為你還要證實你的字彙庫有公信力
這個和一些測量字串距離的方法不太一樣
一些測字串距離的方法是算 A 字串經過數個代換步驟後成 B 字串
然後藉由一些加權的方式,計算出 A 和 B 的距離
看原 po 想用那一種查詢
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 112.105.250.106
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1457441661.A.16B.html
※ 編輯: Neisseria (112.105.250.106), 03/08/2016 20:57:26
→
03/08 23:22, , 1F
03/08 23:22, 1F
→
03/08 23:23, , 2F
03/08 23:23, 2F
→
03/08 23:23, , 3F
03/08 23:23, 3F
→
03/08 23:24, , 4F
03/08 23:24, 4F
→
03/08 23:25, , 5F
03/08 23:25, 5F
→
03/08 23:25, , 6F
03/08 23:25, 6F
→
03/08 23:25, , 7F
03/08 23:25, 7F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):
Python 近期熱門文章
PTT數位生活區 即時熱門文章