Re: [問題] 為何叫電腦科學

看板CSSE (電腦科學及軟體工程)作者lovekkk (kk)時間18年前 (2008/08/06 14:26)推噓2(2推 0噓 0→)

留言2則, 2人參與討論串6/6 (看更多)

※ 引述《as1986 ( )》之銘言： : ※ 引述《Arton0306 (Ar藤)》之銘言： : : 唸CS幾年下來 : : 突然不知CS中的S science的部份在哪裡 : : 像理論方面 algo computation theory graphy theory... 這些都是數學 : : 其它os archi compiler 這比較像工程、設計方面的 : : 至於偏電機的科目就更不用說了 : : 像物理、化學、生物 : : 都有一些理論這些理論是從實驗而驗證的往後也可能一直修正 : : 這也是以往所學的科學方法 : : 但目前我在cs學到的好像很少有這樣 : : 比較像的大概是data mining 猜一些特徵經實驗再去想這些特徵的關連性...等 : : 但這似乎更接近統計學 : : 所以想請教這個science指的是哪部份?? : 有一個相關的問題一直很好奇，就是我們如果透過統計方法讓機器從數據中得到一些 : 參數，我們應該相信那些參數到什麼程度？我指的不是像把台灣二十世紀中每年三十 : 歲男性的身高平均算出來，用這些數據拿來當成某個理論的證據而已；我想問如果我 : 們有個神妙的算法，神妙到沒有什麼真正使用的人知道他的每一個步驟有什麼現實的 : 意義，但是卻能夠給一堆數據某種在統計上合理的解釋（例如可以輸出一個非常相似 : 的 generative model）那麼我們能夠把那個算法的解釋當成像平均數那樣，更進一 : 步給予現實世界的解釋嗎？ : 會這樣問是因為看到 clustering 被廣泛應用，但是我很好奇能不能夠說「因為這堆 : 資料利用 K-means 跑出來會分成這兩堆，所以我們宣稱......」這樣的話？ : 和統計還有機器學習不太熟，如果說錯什麼請大家指正謝謝！我的看法是"看情況" 例如像你說的K-means, 使用上時常也是用幾個不同的k, 每個k再重覆跑很多次, 看有沒有哪個k某幾次跑出來的結果看起來比較合理或者像統計上的相關性, 可能可以找到像"電線桿越多的國家, 某些文明病的發生率較高"這種相關然而因此結論便是"電線桿導致某些文明病"嗎? 大多不是而可能是電線桿較多的國家開發程度也許較高, 也許速食比較盛行, 或吃大魚大肉, 比較多宅宅以OLG或電玩等當休閒較少運動, 污染較嚴重, 農藥使用較普遍, 較會用抗生素荷爾蒙餵養雞豬牛等等, 因而導致某些文明病較盛行也就是說, 找出運作機制仍是相當重要而難以省略的, 例如, 一個國家的肝癌發生率年年提升時, 這幾年中同時提升的, 可能用電線桿數量, 國民飲食的蛋白質攝取量, 汽機車數量及廢氣排放量等, 而究竟是其中何者真正影響到肝癌發生率則是需要進一步研究, 找出這數種因素在生物層面上影響肝癌的作用機制才能強化證據而那些神妙的方法, 我覺得用來找出要進一步深入研究的目標就很好了, 而找出的那些目標究竟是否為真, 合不合理還是要靠人判斷如果期待那些方法能直接找出"確切的證據", 目前似乎還不太可能 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 218.166.54.53