[問題] Raid-5炸掉和合理Raid組磁碟數量分配問題
Hi, 各位Linux前輩請多多指點小弟
事情是這樣,今天早上我確認Raid-5磁碟陣列出現三顆異常便著急更換
操作過程有一些misunderstand和不謹慎,也沒有確認Spare Disk的情況
到底是本來就不可能了,還是我腦殘造成的,已經不可考。
總之,重建失敗,Raid Fail, 資料爸爸、資料媽媽、資料阿公、資料弟弟
祖孫上下三代400TB已經一起上路。
我己經準備提頭跟老闆解釋。
七月的台灣,真的好冷。
-------
木已成舟,重組Raid已經是既定事項,我現在只能想辦法不要重蹈覆側。
我查詢了網路上的一些說法,Raid-5既然只能損毀一顆硬碟
所以有經驗的管理者,都會控制整個Raid組合理的磁碟數量上限
避免重建過程又發生磁碟故障的機率上升
目前接到我手上的Raid組合是4TB*180顆作Raid-5,其中約包含6顆Spare disk
這樣的組合數量是否合理(目前該機器已屆保固期,磁碟故障的狀況已開始較常發生)
我查詢網路上,大多是家用級NAS的討論。商用級storage或SAN的討論比較少。
可以麻煩有經手過商用級SAN的前輩指點個大概概念和經驗嗎?
我目前是希望重做之後打散成3組Raid-5或6,每組再附加2~3顆Hot Spare.
避免再發生組內多顆硬碟同時接近壽終。
有點伸手,這裡先跟各位誠懇致歉,如果有前輩願意指點,我真的很感謝
明天就要上刑場了.., 目前四處都在整理資料中。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.19.132.216 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1565867759.A.933.html
推
08/15 19:25,
6年前
, 1F
08/15 19:25, 1F
→
08/15 19:25,
6年前
, 2F
08/15 19:25, 2F
→
08/15 19:25,
6年前
, 3F
08/15 19:25, 3F
→
08/15 19:27,
6年前
, 4F
08/15 19:27, 4F
我在研究一下手上的機器可不可能做SSD快取方案,畢竟有點舊了
至於異地備援,這真的就不是我能決定的了,畢竟一台含硬碟動輒50~100萬以上
推
08/15 19:29,
6年前
, 5F
08/15 19:29, 5F
→
08/15 19:29,
6年前
, 6F
08/15 19:29, 6F
推
08/15 19:36,
6年前
, 7F
08/15 19:36, 7F
→
08/15 19:36,
6年前
, 8F
08/15 19:36, 8F
→
08/15 19:36,
6年前
, 9F
08/15 19:36, 9F
→
08/15 19:37,
6年前
, 10F
08/15 19:37, 10F
→
08/15 19:37,
6年前
, 11F
08/15 19:37, 11F
→
08/15 19:40,
6年前
, 12F
08/15 19:40, 12F
→
08/15 19:40,
6年前
, 13F
08/15 19:40, 13F
zfs檔案系統倒真的沒有經驗,我再研究有沒有相容性的問題
另外方便請教m大, raidz1 ,2, 3,是否理論上容許1,2,3顆損壞嗎?
推
08/15 19:59,
6年前
, 14F
08/15 19:59, 14F
→
08/15 19:59,
6年前
, 15F
08/15 19:59, 15F
→
08/15 19:59,
6年前
, 16F
08/15 19:59, 16F
→
08/15 20:03,
6年前
, 17F
08/15 20:03, 17F
→
08/15 20:03,
6年前
, 18F
08/15 20:03, 18F
→
08/15 20:03,
6年前
, 19F
08/15 20:03, 19F
推
08/15 20:09,
6年前
, 20F
08/15 20:09, 20F
→
08/15 20:09,
6年前
, 21F
08/15 20:09, 21F
→
08/15 20:10,
6年前
, 22F
08/15 20:10, 22F
→
08/15 20:10,
6年前
, 23F
08/15 20:10, 23F
推
08/15 20:14,
6年前
, 24F
08/15 20:14, 24F
→
08/15 20:15,
6年前
, 25F
08/15 20:15, 25F
→
08/15 20:48,
6年前
, 26F
08/15 20:48, 26F
→
08/15 20:48,
6年前
, 27F
08/15 20:48, 27F
推
08/15 21:08,
6年前
, 28F
08/15 21:08, 28F
目前該storage的用途,據我的了解是分佈式網格的本地資料快取
還有本地使用者計算或模擬結果,資料算是重要但不到不可回復
畢竟Lost掉,表示之前用的CPU時間跟電都浪費掉..., 如果要用到就要重跑。
推
08/15 21:49,
6年前
, 29F
08/15 21:49, 29F
→
08/15 21:50,
6年前
, 30F
08/15 21:50, 30F
短時間內接連換三顆,我想比較接近一次抽三顆
我想原因是一時腦殘以為Hot spare已經替換好
推
08/15 22:01,
6年前
, 31F
08/15 22:01, 31F
→
08/15 22:42,
6年前
, 32F
08/15 22:42, 32F
→
08/15 22:43,
6年前
, 33F
08/15 22:43, 33F
→
08/15 22:44,
6年前
, 34F
08/15 22:44, 34F
→
08/15 22:45,
6年前
, 35F
08/15 22:45, 35F
→
08/15 22:46,
6年前
, 36F
08/15 22:46, 36F
→
08/15 22:46,
6年前
, 37F
08/15 22:46, 37F
推
08/15 22:52,
6年前
, 38F
08/15 22:52, 38F
→
08/15 22:52,
6年前
, 39F
08/15 22:52, 39F
感覺m大,l大回覆,這裡冒昧先跟兩位釐清術語問題(真的是新手
兩位的意思是n個disk做Raid-5,6形成一個邏輯設備,然後加入VG再分割成LVM卷對吧?
那如果其中一個Raid5,6掉了,是只有某個LVM卷會受到影響
還是說整個VG都會受到影響呢?
因為我目前應用上,可能不需要很大一塊卷宗,180塊分成10塊卷,分別Mount其實也是
可行。那我目前考慮如果I/O速度能接受, 可能不需要在做VG合併raid邏輯設備。
推
08/16 00:36,
6年前
, 40F
08/16 00:36, 40F
→
08/16 00:37,
6年前
, 41F
08/16 00:37, 41F
→
08/16 00:37,
6年前
, 42F
08/16 00:37, 42F
s大的意思,就是對某個LVM卷寫入是會分散到VG中各個raid邏輯設備對吧?
如果是這樣,那我應該會盡量向Boss推薦, 未來採用每個raid邏輯設備分開Mount的結構。
一個mount點40TB左右,11個磁碟近1GB/s的I/O讀寫,應當滿足當前需求了。
※ 編輯: maplefff (49.214.148.225 臺灣), 08/16/2019 01:12:11
推
08/16 10:41,
6年前
, 43F
08/16 10:41, 43F
推
08/16 13:33,
6年前
, 44F
08/16 13:33, 44F
→
08/16 13:33,
6年前
, 45F
08/16 13:33, 45F
推
08/19 00:46,
6年前
, 46F
08/19 00:46, 46F
→
08/19 00:46,
6年前
, 47F
08/19 00:46, 47F
推
08/19 09:40,
6年前
, 48F
08/19 09:40, 48F
這個我想有歷史因素,預算都是一期一期的,
可能當時有拿到幾百萬、一千萬就把他建起來
現在建好就比較難,隨便說要拿出一百萬來改善已經有的東西。
尤其是這個狀況很突然,要找廠商規劃一、兩百萬的東西,也是要走流程標出去
遠水救不了近火啊...。
※ 編輯: maplefff (49.216.20.18 臺灣), 08/19/2019 11:13:20
→
08/19 13:40,
6年前
, 49F
08/19 13:40, 49F
→
08/19 13:40,
6年前
, 50F
08/19 13:40, 50F
推
08/19 13:43,
6年前
, 51F
08/19 13:43, 51F
→
08/19 13:43,
6年前
, 52F
08/19 13:43, 52F
→
08/19 13:48,
6年前
, 53F
08/19 13:48, 53F
→
08/19 13:49,
6年前
, 54F
08/19 13:49, 54F
→
08/19 13:50,
6年前
, 55F
08/19 13:50, 55F
推
08/19 19:16,
6年前
, 56F
08/19 19:16, 56F
→
08/19 19:16,
6年前
, 57F
08/19 19:16, 57F
推
08/22 21:38,
6年前
, 58F
08/22 21:38, 58F
→
08/22 21:39,
6年前
, 59F
08/22 21:39, 59F
推
08/23 16:48,
6年前
, 60F
08/23 16:48, 60F
→
08/23 17:17,
6年前
, 61F
08/23 17:17, 61F
→
09/06 19:17,
6年前
, 62F
09/06 19:17, 62F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
Linux 近期熱門文章
21
56
PTT數位生活區 即時熱門文章