[問題] 如何exclude 兩個vectors重複的數

看板R_Language作者 (su)時間9年前 (2016/01/24 14:30), 編輯推噓0(006)
留言6則, 2人參與, 最新討論串1/1
[軟體熟悉度]: 入門 [問題敘述]: 我有兩個vectors 分別叫做 sampledata與controldata controldat是從sampledata隨機取樣3750個 現在我想做一個treatmentdata是把 上述兩個vector重複的數字刪掉 然而, 因為sampledata裡面本身就有重複的數字 如果使用 setdiff這個函數就會發生重複數字被刪除兩次 例如 sampledata{2,3,2,7,5,8,9,8} controldata{2,8} 預期得到結果 sampledata{3,2,7,5,9,8} 我也試過%in% 的方式,但發現都無法如預期 由於資料頗大,我無法確認%in%的問題出在哪 希望大家幫幫我 我才剛開始摸索R 感謝大家 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 72.33.2.245 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1453617023.A.8F9.html

01/25 02:22, , 1F
可以的話不要這樣想。應該先有一個包括所有資料的表格。
01/25 02:22, 1F

01/25 02:23, , 2F
其中這個表格必須有ID欄。你現在沒有ID,所以怎麼切都會
01/25 02:23, 2F

01/25 02:23, , 3F
不知道哪裡出問題。
01/25 02:23, 3F

01/25 02:24, , 4F
又因為你有ID欄,要切資料、取交集聯集都會容易很多。
01/25 02:24, 4F

01/25 02:24, , 5F
如果
01/25 02:24, 5F

01/25 14:09, , 6F
謝謝,換個切入點思考就解決了
01/25 14:09, 6F
文章代碼(AID): #1Mf6z_Zv (R_Language)
文章代碼(AID): #1Mf6z_Zv (R_Language)