[討論] cognitive model/causal ML執行的細節

看板DataScience作者Bionut (生物堅果)時間1年前 (2024/05/15 05:40)推噓17(17推 0噓 53→)

留言70則, 6人參與討論串1/2 (看更多)

想請問有經驗的朋友。我算是跨領域來做ML正在讀博，目前的課題是把ML應用在半導體製程。不知道是不是跨領域，所以思想跟老闆不太一樣（我自己是製程跟物理背景，老闆是純CS ) 目前老闆希望我的研究主題是建立模型+資料統整所有半導體製程的知識。也就是未來有新的製程技術，我們的模型對於新製程的參數能給予準確的預測（就不需要工程師去tune 參數）老闆的目標是讓模型學會製程的因果關係。然後我們目前（我主要負責搜集data ）的資料只有十幾個點，而且沒有搜集不同參數對應的資料。我老闆想做unsupervised model（我自己是傾向supervised ）。總之我怎麼看都不覺得這麼少的資料點可以支持一個非常複雜的模型，其實連普通的NN我都懷疑能訓練起來不會overfit 我的結論很簡單，要嘛我們做簡單一點的model，要嘛嚕起袖子努力去無塵室老資料（反正做實驗的是我）。但我這樣說就被老闆說他做十年資料科學，我沒經驗誰說少數據做不起來？但具體問model怎麼搭建卻得不到明確的輪廓… 對於學物理出身的我，我對於model所謂明確的定義是指：你需要搜集什麼feature，然後目標又是什麼？例如搜集薄膜厚度、半導體線寬、粗糙度…、而目標是電性（電阻、電容 …等）而我的理解是，如果要model認知到一些物理特性，問進去的資料要包含各種想學習的參數的變異。例如，如果要知道薄膜厚度帶來的影響，餵進去的資料需要有一定的薄膜厚度變異。（這是我不解的點之一，我無法理解我老闆的cognitive model如何在不提供相對應物理變異時，學習到對應知識，而在這項參數改變時做出預測？）我的想法很簡單，除非給出某些人為設定的物理背景，如果資料都是在20度時搜集，模式不可能知道實驗改在30度時做要如何反應。這究竟是我的思想還停留在工程師的封閉思維，還是我老闆總在異想天開？同樣的，我想具象化什麼知識要被學習，我老闆也說不出所以然…對於我，我覺得要有明確的研究目標，但我老闆好像是且戰且走，然後覺得這些框架不可能也不應該知道（他常常嗆我，如果你大概知道你要幹嘛，你現在博士就可以畢業了。我OS:我還是要把實驗資料生出來，然後搭model啊）我覺得要有模型框架我才能好好制定實驗計畫（不過他好像沒覺得我需要搜集很多資料XD ) 想請問有經驗的各位怎麼看？是因為我背景不一樣才覺得他說的目標跟方法不科學嗎？我覺得他的理想很好，但需要更多具體怎麼做模型，還有怎麼搜集能讓模型理解的資料…） p.s.我們最近在向學校提交報告也被其他教授質疑，但其實我早就質疑這個計畫，卻一直被當作不懂ML。（其他教授不是CS背景，我們是研究機構不是純學術） -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 94.109.173.26 (比利時) ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1715722831.A.020.html

推

chang1248w

05/15 13:54, 1年前 , 1^F

05/15 13:54, 1^F

推

chang1248w

05/15 13:57, 1年前 , 2^F

05/15 13:57, 2^F

→

chang1248w

05/15 14:03, 1年前 , 3^F

05/15 14:03, 3^F

推