[問題] 想做服務監控自動重啟

看板Linux作者 (小豆子)時間8年前 (2017/11/15 10:48), 8年前編輯推噓6(6018)
留言24則, 8人參與, 8年前最新討論串1/1
板上的大大們好 小弟我最近要做系統服務的死活監控 監控的項目包含 httpd snmp named nginx redis-server node mysqld mongod PM2 memcached 服務都有加上enable自動啟動 為了保險 寫了一隻script 確認運作期間的狀態 systemctl status $line | grep running && echo "$line OK" || echo "$line error !" 但是考慮到服務hang住 或是重啟一直失敗之類的狀況 想請教除了我這種使用systemctl及service status的方式 或是telnet確認port狀態 , wget針對網頁服務測試 還有沒有別的方式呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.14.142 ※ 文章網址: https://www.ptt.cc/bbs/Linux/M.1510714119.A.9EA.html

11/15 12:33, 8年前 , 1F
nagios ? 你大概需要這種監視服務
11/15 12:33, 1F

11/15 12:34, 8年前 , 2F
只是老實說稍微複雜,不是非常易用的軟體
11/15 12:34, 2F
nagios的設定真的有一點複雜 我暫時不考慮使用 目前是有cacti 但是只有發告警mail和額外寫的簡訊傳送 沒有自動重新啟動服務 其實我有一點擔心mysql跟mongo可不可以這樣直接重啟 感覺出問題的時候要是自動重啟會導致資料完整性出問題 謝謝大大推薦一套好軟體 我覺得ansible也不錯 不過我還沒那麼熟練XD

11/15 13:23, 8年前 , 3F
systemd service 檔案有個 Restart= 選項可以自動服務
11/15 13:23, 3F

11/15 13:26, 8年前 , 4F
可以先用 man systemd.service 看看這功能是否適合使用
11/15 13:26, 4F

11/15 13:26, 8年前 , 5F
再用 systemctl edit 把 Restart= 參數加上去
11/15 13:26, 5F
請問lantw44大大 我用root下了systemctl edit httpd之後內容是空白的這樣是正常的嗎? 這讓我很驚恐TT 我好害怕是我做了什麼把它內容全部殺光了 ※ 編輯: chabaterii09 (122.116.14.142), 11/15/2017 13:57:25

11/15 14:30, 8年前 , 6F
是正常的,因為 systemctl edit 的作法是在
11/15 14:30, 6F

11/15 14:31, 8年前 , 7F
/etc/systemd/system 底下建一個資料夾在裡面寫 .conf 檔
11/15 14:31, 7F

11/15 14:33, 8年前 , 8F
這樣就不會直接動到 service 檔,更新時才不會被覆寫掉
11/15 14:33, 8F

11/15 14:34, 8年前 , 9F
改完可以用 systemctl cat 看到一個服務有多少這種檔案
11/15 14:34, 9F
感覺這樣很方便管理 等等有時間繼續弄監控項目來試試 感謝大大分享技術

11/15 15:05, 8年前 , 10F
Ubuntu 有一個monit 的套件,預設就可以監控httpd等常用服務
11/15 15:05, 10F

11/15 15:08, 8年前 , 11F
範例說明 goo.gl/WEkmyM
11/15 15:08, 11F
我現在都不敢用ubintu了 自從我搞掛了好幾台ubuntu主機後 我乖乖的回歸cent了XD ※ 編輯: chabaterii09 (122.116.14.142), 11/15/2017 15:22:23

11/15 15:51, 8年前 , 12F
centos 也有這套件 goo.gl/qd8js8
11/15 15:51, 12F

11/15 23:23, 8年前 , 13F
svscan
11/15 23:23, 13F

11/15 23:24, 8年前 , 14F
nagios 裝起來一堆寫好的 plugin 隨插即用 哪裡困難阿
11/15 23:24, 14F

11/16 01:25, 8年前 , 15F
munin + monit
11/16 01:25, 15F

11/16 23:09, 8年前 , 16F
supervisord...怎麼沒人提呢?
11/16 23:09, 16F

11/16 23:17, 8年前 , 17F
跟systems 是同類的東西,如果只是要重啟夠用了,
11/16 23:17, 17F

11/16 23:17, 8年前 , 18F
有web gui跟導log的功能,不過你這麼多服務,學個
11/16 23:17, 18F

11/16 23:17, 8年前 , 19F
經典的nagios啊,介面是有點陽春,但是你提到的那
11/16 23:17, 19F

11/16 23:17, 8年前 , 20F
些全部都有現成的plugin,上手後隨插即用
11/16 23:17, 20F

11/18 20:00, 8年前 , 21F
mongod異常退出的話,是無法直接重啟的,因為會被lock f
11/18 20:00, 21F

11/18 20:00, 8年前 , 22F
ile卡住,要先下完 --repair 才有辦法重新打開
11/18 20:00, 22F

11/28 04:37, 8年前 , 23F
keepalived 運用在NGINX httpd應該是沒問題,其他服務沒試過
11/28 04:37, 23F

11/28 04:37, 8年前 , 24F
,給您參考
11/28 04:37, 24F
感謝樓上所有大大的建議 不過因爲工項吃緊 所以我還是選擇寫shell省去研讀的時間XD 真的覺得以前不好好專研套件和英文現在真的很辛苦 ※ 編輯: chabaterii09 (223.136.41.162), 11/28/2017 20:50:47
文章代碼(AID): #1Q2wi7dg (Linux)
文章代碼(AID): #1Q2wi7dg (Linux)