PTT數位生活區 / Python

[問題] pyspark mapPartitions

看板Python作者left (881 forever)時間9年前 (2016/12/06 18:16)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/1

各位大大好下面是小的在玩mapPartitions時的程式片段、執行結果以及問題測試環境： --master local[*] 程式片段： rdd = sc.parallelize([ [1, 2, 3], [3, 2, 4], [5, 2, 7] ] , 10) def test(partitions): yield 1 #workable #return 1 #error #return [1] #workable rdd_test = rdd.mapPartitions(test) s = rdd_test.collect() print s print rdd_test.getNumPartitions() 結果： [1, 1, 1, 1, 1, 1, 1, 1, 1, 1] 10 問題：似乎如果要將每個partition映射成一個value輸出時(上面是以value=1為例) 都需要用yield value，不能像map一樣直接用return。如果要用return，就要弄成 return [value]。我目前測試的結果是這兩種方式最後用collect會產生相同的結果。這背後的道理以及原因是什麼啊？ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.220.35.20 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1481019366.A.D57.html

‣ 返回看板[ Python ] 程設

‣ 更多 left 的文章

文章代碼(AID): #1OHe_crN (Python)

Python 近期熱門文章

1

1

[問題] python 3.14 free thread build

2周前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

3周前, 10/22

5

8

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

1月前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

4月前, 07/19

15

23

[閒聊] 各位現在用os.path 還是用pathlib.Path

4月前, 07/17

5

10

[閒聊] 2024年的自我python學習

4月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

7月前, 04/01

1

3

[問題] selenium 有辦法做檔案上傳嗎?

9月前, 02/03

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

3

23

[請益] 小機殼求推薦 ( ATX電源 + 3 or 4槽PCI

[ PC_Shopping ]

7小時前, 11/17

16

27

[問題] x300夜拍跟發熱跟原子島的問題

8小時前, 11/17

7

8

[賣/台北/皆可] 威剛XPGD10 DDR4-3600 16G*2雙通

[ HardwareSale ]

10小時前, 11/16

7

10

Re: [討論] 夜拍人像推哪一台？OPPO、vivo、三星

10小時前, 11/16

5

34

2023時申辦的台星299終生約問題

12小時前, 11/16

-4

6

[請益] 靜電容鍵盤比較已刪文

[ PC_Shopping ]

12小時前, 11/16

3

16

Re: [問題] 請問磁吸改成有線充電問題?(如1664)

13小時前, 11/16

2

16

[菜單] 50-60K附近的工作為主遊戲為輔

[ PC_Shopping ]

13小時前, 11/16

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 left 的文章

文章代碼(AID): #1OHe_crN (Python)