Re: [問題] 為何叫電腦科學

看板CSSE (電腦科學及軟體工程)作者 (kk)時間16年前 (2008/08/06 14:26), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串6/6 (看更多)
※ 引述《as1986 ( )》之銘言: : ※ 引述《Arton0306 (Ar藤)》之銘言: : : 唸CS幾年下來 : : 突然不知CS中的S science的部份在哪裡 : : 像理論方面 algo computation theory graphy theory... 這些都是數學 : : 其它os archi compiler 這比較像工程、設計方面的 : : 至於偏電機的科目就更不用說了 : : 像物理、化學、生物 : : 都有一些理論 這些理論是從實驗而驗證的 往後也可能一直修正 : : 這也是以往所學的科學方法 : : 但目前我在cs學到的好像很少有這樣 : : 比較像的大概是data mining 猜一些特徵 經實驗 再去想這些特徵的關連性...等 : : 但這似乎更接近統計學 : : 所以想請教這個science指的是哪部份?? : 有一個相關的問題一直很好奇,就是我們如果透過統計方法讓機器從數據中得到一些 : 參數,我們應該相信那些參數到什麼程度?我指的不是像把台灣二十世紀中每年三十 : 歲男性的身高平均算出來,用這些數據拿來當成某個理論的證據而已;我想問如果我 : 們有個神妙的算法,神妙到沒有什麼真正使用的人知道他的每一個步驟有什麼現實的 : 意義,但是卻能夠給一堆數據某種在統計上合理的解釋(例如可以輸出一個非常相似 : 的 generative model) 那麼我們能夠把那個算法的解釋當成像平均數那樣,更進一 : 步給予現實世界的解釋嗎? : 會這樣問是因為看到 clustering 被廣泛應用,但是我很好奇能不能夠說「因為這堆 : 資料利用 K-means 跑出來會分成這兩堆,所以我們宣稱......」這樣的話? : 和統計還有機器學習不太熟,如果說錯什麼請大家指正 謝謝! 我的看法是"看情況" 例如像你說的K-means, 使用上時常也是用幾個不同的k, 每個k再重覆跑很多次, 看有沒有哪個k某幾次跑出來的結果看起來比較合理 或者像統計上的相關性, 可能可以找到像"電線桿越多的國家, 某些文明病的發生率較高"這種相關 然而因此結論便是"電線桿導致某些文明病"嗎? 大多不是 而可能是電線桿較多的國家開發程度也許較高, 也許速食比較盛行, 或吃大魚大肉, 比較多宅宅以OLG或電玩等當休閒較少運動, 污染較嚴重, 農藥使用較普遍, 較會用抗生素荷爾蒙餵養雞豬牛等等, 因而導致某些文明病較盛行 也就是說, 找出運作機制仍是相當重要而難以省略的, 例如, 一個國家的肝癌發生率年年提升時, 這幾年中同時提升的, 可能用電線桿數量, 國民飲食的蛋白質攝取量, 汽機車數量及廢氣排放量等, 而究竟是其中何者真正影響到肝癌發生率則是需要進一步研究, 找出這數種因素在生物層面上影響肝癌的作用機制才能強化證據 而那些神妙的方法, 我覺得用來找出要進一步深入研究的目標就很好了, 而找出的那些目標究竟是否為真, 合不合理還是要靠人判斷 如果期待那些方法能直接找出"確切的證據", 目前似乎還不太可能 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.166.54.53

08/06 15:08, , 1F
可是電線桿逐漸在地下化了
08/06 15:08, 1F

08/06 19:01, , 2F
應該是 電線桿密度
08/06 19:01, 2F
文章代碼(AID): #18cKGYYF (CSSE)
文章代碼(AID): #18cKGYYF (CSSE)