[問題] 使用condor系統如何submit平行運算

看板Linux作者 (新生活!~)時間16年前 (2010/02/27 23:46), 編輯推噓3(307)
留言10則, 4人參與, 最新討論串1/1
在unix中管理job的分配有一套叫做condor的系統 如果要丟job到server讓它找你分配cpu來運算, 通常都是使用condor_submit condor.sh condor.sh是一個shell script大致如下: universe = vanilla initialdir = /home/u8/users/burkardt/phoenix_test executable = foo.sh log = foo.log output = foo.output queue 如果今天在我要跑的job裡面,如上面的foo.sh 有執行了一個套裝軟體(gromacs)內好幾個不同的指令, 只有其中一行是要做平行運算的: grompp_d xxxxxx mpirun -np 8 mdrun_mpi_d xxxxxxx trjconv_d xxxxxxxxx 如上面三行,只有中間一行的指令是做平行運算 這樣子要丟job到condor系統 我把condor.sh改成 universe = MPI initialdir = /home/u8/users/burkardt/phoenix_test executable = foo.sh log = foo.log output = foo.output machine_count = 8 queue 然後用condor_submit condor.sh去執行,得不到輸出檔 我也上網去查一些範例,關於MPI的submit,看到的都是單一執行檔 如C語言的xxx.c 或fortran的 xxx.f 可是我要submit的是shell script而且裡面都是commend不是code, 這些commend還是單機還平行的各佔一部份 請問有人知道怎麼樣submit這種shell script到condor系統中呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.109.103.226

02/28 00:21, , 1F
condor 貴單位應該有不少高手吧...怎麼會在這邊問呢? :p
02/28 00:21, 1F

02/28 00:44, , 2F
找不到人問,大家使用需求不同 = =
02/28 00:44, 2F

02/28 01:01, , 3F
foo.sh檔案的執行權限?
02/28 01:01, 3F

02/28 01:15, , 4F
-rwxr-xr-x 應該不是這個東西的問題,是嗎 @@
02/28 01:15, 4F

02/28 10:38, , 5F
那把foo.sh裡的指令全都寫成絕對路徑?
02/28 10:38, 5F

02/28 10:39, , 6F
可參考看看這篇 http://0rz.tw/Lc3mf
02/28 10:39, 6F

02/28 18:10, , 7F
試了,無效....不過還是謝了
02/28 18:10, 7F

03/01 00:38, , 8F
也許你要看看state,說不定一直pending
03/01 00:38, 8F

03/01 00:42, , 9F
輸出err看看
03/01 00:42, 9F

03/01 19:58, , 10F
輸出err一直是空白 XD out也是一樣
03/01 19:58, 10F
文章代碼(AID): #1BYJvTVO (Linux)
文章代碼(AID): #1BYJvTVO (Linux)