討論串[討論] 機器學習如何做好version control???
共 5 篇文章
內容預覽:
大家好. 我是ML新手 跟的前輩是很優秀的超強者. 但是前輩很不organized 寫的code總是不commit. 主管希望下個項目之前我可以提出報告要如何改進並且希望前輩能跟進. 我是覺得ML和其他寫程式有點不同. 因為不斷測試參數 每次調參數都commit的話好像太繁雜 所以我一般是有了好結果
(還有302個字)
內容預覽:
讓小孬孬我來獻醜一下. 不太確定你的計畫的細節 但聽起來好像是 每次調參數. (這裡的參數應該是指超參數的意思吧?). 都要*手動*改script. 如果是這樣的話 你們的這個script寫的不好用. 應該要弄一個類似入口 控制台的地方. 這個控制台可以讓你輸入訓練資料和超參數 並且*自動*存下lo
(還有228個字)
內容預覽:
我寫一點自己的想法。除了推文裡寫的. 我的作法是. 開兩個repository. 假設專案叫xyz. 那我會開一個 xyz-explore 另一個 xyz-prod. xyz-explore裡面可能很亂 不會完全照 software version control 的方式作. 但只要作出比目前存在
(還有589個字)
內容預覽:
你可以commit到另一個branch. master branch只放乾淨的程式碼, 然後設定限制, 永遠不能被直接commit. 只能透過送pull request的方式. 這一種方式在一般軟體開發很常用. http://nvie.com/posts/a-successful-git-branc
(還有437個字)
內容預覽:
有一個比較新的工具叫dvc (data version control). 詳情: https://github.com/dataversioncontrol/dvc. 它的核心概念大概是這樣︰. 1) 當你新增data時,產生一組md5 hash作為cache路徑,而這個路徑. 是data的har
(還有329個字)