Re: [SQL ] 找交集

看板Database (資料庫)作者 (牛奶)時間17年前 (2007/05/26 17:54), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串3/6 (看更多)
其實我是在做dataming的作業,在尋找資料的特性 所以資料庫才會這樣大 可以請你解釋一下做法嗎 我用的是mySQL 的環境 因為其實table_1 與table_2 都是兩個query出的結果,所以是沒有index的 但是各別執行都花不到一秒 但是做卡氏積就太大了 ※ 引述《flakchen (flak)》之銘言: : 以MS-SQL而言,這種「只在乎曾經擁有,不需要一起顯示」的問題 : 用in或exists會比join有效率 : 會爆炸可能是沒有建index,對COL1建index會好很多 : 但資料多到一定地步,硬體資源又不夠的話.....該爆炸的還是會爆炸 : ※ 引述《asio1 (牛奶)》之銘言: : : TABLE_1 TABLE_2 : : COL1 COL1 : : A A : : B D : : C E : : D G : : E H : : F J : : G L : : 兩個個別TABLE_1.COL1還有 TABLE_2.COL1的值都不會重複出現 : : 問題是這樣的 : : 就是找出 TABLE_1.COL1 = TABLE_2.COL1 有多少個 : : 所以應該下 : : SELECT COUNT(*) FROM TABLE_1,TABLE_2 WHERE TABLE_1.COL1=TABLE_2.COL1 : : 但是呢問題就是各有20萬ROW 兩個作卡式積 馬上就爆炸了 : : 不知道有沒有其他的寫法 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.123.146.140 ※ 編輯: asio1 來自: 122.123.146.140 (05/26 17:56)
文章代碼(AID): #16M0FQjA (Database)
討論串 (同標題文章)
本文引述了以下文章的的內容:
以下文章回應了本文
完整討論串 (本文為第 3 之 6 篇):
17年前, 05/25
文章代碼(AID): #16M0FQjA (Database)