[問題] 問一個分群的問題
看板Prob_Solve (計算數學 Problem Solving)作者Arim (Arim5566)時間13年前 (2011/08/26 23:16)推噓2(2推 0噓 1→)留言3則, 1人參與討論串1/1
※ [本文轉錄自 CSSE 看板 #1ELxR3XF ]
作者: Arim (Arim5566) 看板: CSSE
標題: [問題] 問一個分群的問題
時間: Fri Aug 26 23:07:42 2011
各位板友好
小弟最近碰到一個分群的問題
首先我有一個term-by-document的matrix
假設我有8個term是A B C D E F G H
想利用cos similarity對這8個term做分群
分群的條件是群內的任兩個term的cos similarity都大於等於門檻值
例如最後分出來的最大的兩群為(A B C D) 以及 (F G H)
群內的任意兩個term的cos similarity都大於等於門檻值
但是目前能想到的方法只有暴力法
例如先找跟A的cos similarity大於等於門檻值的term
可以先找到(A B C D E)這一個群,這時候就跑迴圈檢查B C D E的相似度
在迴圈的過程中發現B跟E不相似,所以要把E或B拿掉,如果把E拿掉的話,
會變成(A B C D),之後檢查C跟D也符合條件,就輸出(A B C D)這一個群,
但如果把B拿掉的話,會變成(A C D E),但可能之後的檢查過程中發
現C跟E又不相似,之後把C拿掉,接著D跟E又不相似,之後把D拿掉,到最後只會
剩下(A E),但是(A E)這一群並不是最大的...請問有什麼有效率的演算法有辦法
解決目前我遇到的這個問題嘛?
我覺得這問題應該跟傳統利用cos similarity做文件分群是一樣的演算法
只是一直找不到該演算法
謝謝指教
--
~宅男的四個徵兆~
∠□ ○ ! * \○/ ★ (○ ?
╦╦└□ " ○□═ □ □>
║║√√ ╦══╦ ∥ |\
一回家就上PTT 每天想正妹 以當好人為樂 忘記正妹虧欠自己
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.32.197.57
※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:09)
※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:10)
※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:11)
※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:13)
※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:13)
--
~宅男的四個徵兆~
∠□ ○ ! * \○/ ★ (○ ?
╦╦└□ " ○□═ □ □>
║║√√ ╦══╦ ∥ |\
一回家就上PTT 每天想正妹 以當好人為樂 忘記正妹虧欠自己
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.32.197.57
※ 編輯: Arim 來自: 114.32.197.57 (08/27 00:08)
推
08/27 00:14, , 1F
08/27 00:14, 1F
→
08/27 00:14, , 2F
08/27 00:14, 2F
推
08/27 00:16, , 3F
08/27 00:16, 3F
Prob_Solve 近期熱門文章
PTT數位生活區 即時熱門文章