討論串[問題] 製作dummy variable矩陣效能問題
共 5 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者mowgur (PINNNNN)時間7年前 (2017/12/29 14:01), 編輯資訊
2
0
2
內容預覽:
*[m- 問題: 當你想要問問題時,請使用這個類別。. 建議先到 http://tinyurl.com/mnerchs 搜尋本板舊文。. [問題類型]:. 效能諮詢(我想讓R 跑更快). [軟體熟悉度]:. 使用者(已經有用R 做過不少作品). [問題敘述]:. 大家好 我的資料是紀錄籃球比賽每個p
(還有1573個字)

推噓0(0推 0噓 1→)留言1則,0人參與, 7年前最新作者tan800630 (天ㄦ)時間7年前 (2017/12/29 15:23), 7年前編輯資訊
0
0
3
內容預覽:
同上一篇我自己的回文,這個code絕對還有很大的進步空間:p. 請版上的各位再不吝指教. 我自己想的方向是先把資料整理成long_format的資料格式,再用dcast轉形狀. 模擬的資料筆數較大時兩個方法運作時間會差比較多. 因此我把n設成10000而非原本的1000(在n=1000時甚至你的方法
(還有592個字)

推噓1(1推 0噓 4→)留言5則,0人參與, 7年前最新作者andrew43 (討厭有好心推文後刪文者)時間7年前 (2017/12/30 00:23), 7年前編輯資訊
0
0
2
內容預覽:
我按你需要的 750000 x 1000 為目標。. 有一個前題是,500 位球員的名字(我叫name.player)要預先知道,. 不然要事先從原始資料中生成。. 我是把攻擊和防守可以分開處理,但其實方法是一樣的。. 主要用 %in% 來對比進行比對,再把T/F換成1/0或-1/0。. 轉換過程以
(還有1267個字)

推噓3(3推 0噓 6→)留言9則,0人參與, 8年前最新作者Wush978 (拒看低質媒體)時間7年前 (2017/12/30 21:20), 編輯資訊
1
0
3
內容預覽:
你的問題,剛好等價於在文字探勘中建立document term matrix. ps. 給一段文字(一個字串),用空格或其他符號切割後建立矩陣. 感謝前面幾位板友的分享,不過我從這個角度切入問題後,. 可以站在巨人的肩膀來解問題(也就是以下的程式跑得比較快,是因為套件作者寫的好). 目前我覺得R 裡
(還有568個字)

推噓3(3推 0噓 0→)留言3則,0人參與, 7年前最新作者celestialgod (天)時間7年前 (2018/01/08 19:28), 7年前編輯資訊
0
0
9
內容預覽:
之前不方便回文,今天終於有空來提供一下我的方法XD. 我是直接用fastmatch這個套件,找出需要的index直接得到sparse matrix. 比較一下andrew大跟wush大的方法(單核心3.87 GHz下),我的方法可以快上近4倍. 好讀版:https://pastebin.com/yS
(還有3938個字)
首頁
上一頁
1
下一頁
尾頁