關於在GCP上的training
各位前輩好
最近我在使用google cloud platform 建立vm來training yolo的模型
環境都已經設置完畢也可以跑,但遇到過了15min-20min job會被砍掉
有嘗試用watch -n 1 nvidia-smi來監看也是會斷線
有上網查可能是runtime limits(?
想請問各位前輩有遇到這樣的問題嗎
謝謝
Ps 硬體設置4-cores+15gb ram +k80
Cpu使用率對時間
https://i.imgur.com/83CDdqT.jpg
-----
Sent from JPTT on my iPhone
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.72.18.185 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1662884564.A.CA7.html
推
09/11 16:58,
2年前
, 1F
09/11 16:58, 1F
→
09/11 16:58,
2年前
, 2F
09/11 16:58, 2F
→
09/11 17:23,
2年前
, 3F
09/11 17:23, 3F
→
09/11 17:23,
2年前
, 4F
09/11 17:23, 4F
→
09/11 17:23,
2年前
, 5F
09/11 17:23, 5F
→
09/12 00:09,
2年前
, 6F
09/12 00:09, 6F
→
09/12 00:09,
2年前
, 7F
09/12 00:09, 7F
→
09/12 00:11,
2年前
, 8F
09/12 00:11, 8F
→
09/12 16:17,
2年前
, 9F
09/12 16:17, 9F
→
09/12 16:17,
2年前
, 10F
09/12 16:17, 10F
→
09/12 16:18,
2年前
, 11F
09/12 16:18, 11F
推
09/12 20:05,
2年前
, 12F
09/12 20:05, 12F
噓
09/30 15:46,
2年前
, 13F
09/30 15:46, 13F
→
10/13 09:08,
2年前
, 14F
10/13 09:08, 14F
→
10/13 09:08,
2年前
, 15F
10/13 09:08, 15F
→
10/13 09:08,
2年前
, 16F
10/13 09:08, 16F
→
10/13 09:08,
2年前
, 17F
10/13 09:08, 17F
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章