[問題] 問一個分群的問題

看板Prob_Solve (計算數學 Problem Solving)作者 (Arim5566)時間13年前 (2011/08/26 23:16), 編輯推噓2(201)
留言3則, 1人參與, 最新討論串1/1
※ [本文轉錄自 CSSE 看板 #1ELxR3XF ] 作者: Arim (Arim5566) 看板: CSSE 標題: [問題] 問一個分群的問題 時間: Fri Aug 26 23:07:42 2011 各位板友好 小弟最近碰到一個分群的問題 首先我有一個term-by-document的matrix 假設我有8個term是A B C D E F G H 想利用cos similarity對這8個term做分群 分群的條件是群內的任兩個term的cos similarity都大於等於門檻值 例如最後分出來的最大的兩群為(A B C D) 以及 (F G H) 群內的任意兩個term的cos similarity都大於等於門檻值 但是目前能想到的方法只有暴力法 例如先找跟A的cos similarity大於等於門檻值的term 可以先找到(A B C D E)這一個群,這時候就跑迴圈檢查B C D E的相似度 在迴圈的過程中發現B跟E不相似,所以要把E或B拿掉,如果把E拿掉的話, 會變成(A B C D),之後檢查C跟D也符合條件,就輸出(A B C D)這一個群, 但如果把B拿掉的話,會變成(A C D E),但可能之後的檢查過程中發 現C跟E又不相似,之後把C拿掉,接著D跟E又不相似,之後把D拿掉,到最後只會 剩下(A E),但是(A E)這一群並不是最大的...請問有什麼有效率的演算法有辦法 解決目前我遇到的這個問題嘛? 我覺得這問題應該跟傳統利用cos similarity做文件分群是一樣的演算法 只是一直找不到該演算法 謝謝指教 -- ~宅男的四個徵兆~ ∠□ ○ ! * \○/ ★    (○ ? ╦╦└□ " ○□═ □   □> ║║√√ ╦══╦ ∥    |\ 一回家就上PTT 每天想正妹 以當好人為樂 忘記正妹虧欠自己 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.32.197.57 ※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:09) ※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:10) ※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:11) ※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:13) ※ 編輯: Arim 來自: 114.32.197.57 (08/26 23:13) -- ~宅男的四個徵兆~ ∠□ ○ ! * \○/ ★    (○ ? ╦╦└□ " ○□═ □   □> ║║√√ ╦══╦ ∥    |\ 一回家就上PTT 每天想正妹 以當好人為樂 忘記正妹虧欠自己 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.32.197.57 ※ 編輯: Arim 來自: 114.32.197.57 (08/27 00:08)

08/27 00:14, , 1F
提示: 其實你只要知道任兩個 term 是不是大於門檻值即可
08/27 00:14, 1F

08/27 00:14, , 2F
剩下的是 clique problem
08/27 00:14, 2F

08/27 00:16, , 3F
然後這裡是一桶冷水: clique problem 是 NP-Complete...
08/27 00:16, 3F
文章代碼(AID): #1ELxZMy5 (Prob_Solve)
文章代碼(AID): #1ELxZMy5 (Prob_Solve)