[轉錄]Re: [情報] IBM式轉型 巨頭紛紛跟進 雲端
※ [本文轉錄自 Soft_Job 看板 #1Dkfm3cN ]
作者: leicheong (睡魔) 看板: Soft_Job
標題: Re: [情報] IBM式轉型 巨頭紛紛跟進 雲端
時間: Fri Apr 29 19:07:44 2011
※ 引述《Obb (有趣的世界)》之銘言:
: 台灣一向走得比較慢半拍
: 雲端的市場越來越集中囉
: http://www.jobbole.com/content.php/1101
: 發表於2011-04-28 07:30 AM
: 越來越多IT巨頭進入集體轉型期。日前,全球第二大PC廠商戴爾宣佈,將投入10億美
: 元建設數據中心,進一步開發雲計算服務,標誌著戴爾從傳統PC廠商向解決方案供應商(
: IT服務)轉型。
: [Deleted]
其實看到大家在討論「雲」, 有一個問題好像很少人討論的.
就是因為硬體做成的軟體執行錯誤問題.
在維護伺服器的時期大概發生過一、兩次系統穩定性的問題, 是和
某條記憶體有問題有關的. 這在一般單台伺服器很容易檢查, 只要
選一個晚上跑一下memtest就可以了吧. 可是在「雲端」呢? 不見得
每間公司都有規定花時間跑相關的檢查程式, 再安裝平台的操作系統
吧. 大多數都是看系統能跑起來就會「收貨」了.
如果有記憶體問題而不影響系統的話 (例如6條記憶體只有一條有問題
的場合, 因為系統效能的問題kernel區域一般會在連續的位址. 也就是
說這些系統只要開機時剛好沒載入到有問題的記憶體, 重開機前一般
也不會再碰到, 只會影響新執行的應用程式), 你的程式懷疑可能是
硬件問題而導致出錯的話, 有甚麼方法可以nail down問題呢?
事情還會再複雜一點. 因為「雲端」的性質, 你無法確認出問題的
instance是在那台伺服器執行的. 也許你再跑一次, 程式在另一台
伺服器執行你就完全看不到問題, 但你無法知道下一次再執行時
會不會又在有問題的記憶體執行. 這樣就算你用某些方法能夠
鎖定是記憶體問題, 你也無法向供應商證明. 他們也該基於公司
政策拒絕承認是他們的問題吧.
再考慮一些其他情況, 例如空調系統因事故停止運轉等. (雖然
數據中心一般會有兩組以上的可獨立維持運行的空調機組, 但
常看TDWTF的人對"有可能失效的系統都有可能一起失效"這說法
應該不會有意見吧. 真的失效的時候一般都是按既定程序盡快
恢復就是結束了. 不過失效期間做成的高溫是有可能損害硬體的.
我目前沒有看到任何一間「雲端」服務供應商有指引安排在出現
空調事故並持續若干時間後對整個房間的伺服器安排進行檢查的.
一些普通的應用程式當掉重跑也許沒問題. 可是如果是商用的,
特別是金融類的呢?
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.92.4.195
※ 編輯: leicheong 來自: 61.92.4.195 (04/29 19:08)
推
04/29 19:49,
04/29 19:49
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.137.203.163
推
04/29 19:54, , 1F
04/29 19:54, 1F
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
Cloud 近期熱門文章
PTT數位生活區 即時熱門文章