看板 [ Python ]
討論串[問題] spark 資料減去平均值
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者thefattiger (LawTea)時間6年前 (2018/10/01 20:26), 編輯資訊
0
0
0
內容預覽:
沒用過Spark,但看起起來跟它無關. from collections import defaultdict. x = [(1,10),(1,20),(2,10)] #your data. avg = defaultdict(lambda:[0,0]). for ID,data in x:. av
(還有93個字)

推噓0(0推 0噓 1→)留言1則,0人參與, 6年前最新作者comeonbaby (來巴寶貝)時間6年前 (2018/10/01 13:35), 編輯資訊
0
0
0
內容預覽:
目前資料已分成一串tuple存在RDD裡面 (ID, Data). 目前想做的是將Data值減去其ID的Data平均值. 例如: (1,10) (1,20) (2,10) 跑完後會變成. (1,-5) (1,5) (2,0) 這樣. 因為剛接觸不太清楚該怎麼實作. --. 發信站: 批踢踢實業坊
首頁
上一頁
1
下一頁
尾頁