[問題] movielens將電影類別分類

看板R_Language作者 (locka)時間10年前 (2014/05/26 15:33), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串1/2 (看更多)
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 入門(寫過其他程式,只是對語法不熟悉) [問題敘述]: 請簡略描述你所要做的事情,或是這個程式的目的 不曉得這裡有沒有人在玩movielens的資料? 我從movielens 下載電影的資料 其中有一個叫做movies.dat的檔案 movielens 10M: http://grouplens.org/datasets/movielens/ 經過我整理後存成一個三個欄位的data frame 如下: ID Title Genres 1 Toy Story Adventure|Animation|Children|Comedy|Fantasy 2 Jumanji Adventure|Children|Fantasy ... ... ... 電影的類型總共有18種 但上述Genres欄位只會顯示該電影的類型 而我今天想要想要玩的是 針對Genres這個欄位做類似購物籃分析的事情,找出哪些電影屬性相似 也就是想要產生一個data frame紀錄電影類型的向量 例如如果某部電影是動作片則動作片欄位值為1 反之為0 最後想要產生的結果如下 ID Adventure Animation Children Comedy Fantasy ...... 1 1 1 1 1 1 ...... 2 1 0 1 0 1 ...... ... ... ... ... ... ... ...... 我最初的想法是先為每種電影類型新增欄位 將其預設值設為0 然後逐一比對genres欄位 如果有match則將值改為1 不過當我輸入以下指令以後 movie <- data.frame("ID"=movies$V1, "Adventure", "Animation",...) 欄位變成 ID X.Adventure X.Animation X.children..... 1 Action Animation Children 2 Action Animation Children ... 不知道該如何下手...(搔頭) 亦或是有其他更好的作法也歡迎討論 希望大家可以提點一下小的,感激不盡啊! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.80.238 ※ 文章網址: http://www.ptt.cc/bbs/R_Language/M.1401089588.A.B1D.html

05/26 16:06, , 1F
請問是類似這樣嗎? http://0rz.tw/CdTRr
05/26 16:06, 1F

05/26 17:48, , 2F
我覺得應該可以...可是不好意思我想請問一下我該如何把
05/26 17:48, 2F

05/26 17:51, , 3F
Action|Comedy...的資料變成"Action","comedy"...的形式呢?
05/26 17:51, 3F
文章代碼(AID): #1JWkuqiT (R_Language)
文章代碼(AID): #1JWkuqiT (R_Language)