摘要:前言告警將重要信息發(fā)送給運維或者其他相關(guān)人,及時發(fā)現(xiàn)并且處理問題。在所有開源監(jiān)控軟件里面,的告警方式無疑是最棒的。在發(fā)生告警之后立即發(fā)送郵件和微信消息給用戶,分鐘后還未確認(rèn),那么發(fā)送短信,分鐘還未確認(rèn)則打電話給用戶。
1. 前言
告警將重要信息發(fā)送給運維「或者其他相關(guān)人」,及時發(fā)現(xiàn)并且處理問題。在所有開源監(jiān)控軟件里面,Zabbix 的告警方式無疑是最棒的。告警的方式各式各樣,從 Email 告警到飛信、139/189郵箱、最后到微信甚至電話告警,接入存在各種問題以及困難,有沒有什么軟件能夠?qū)⑺麄傾ll In one呢?OneAlert
2. Zabbix傳統(tǒng)告警方法Email:調(diào)用 sendmail 、sendEmail 等腳本通過 SMTP 發(fā)送郵件
飛信:飛信已經(jīng)退出歷史舞臺,不再有人使用
189/139:發(fā)送郵箱郵件至郵箱,郵箱將短信轉(zhuǎn)到用戶手機短信,存在一定的延遲
微信:需要申請一個微信公眾號,并接入API,整個流程比較復(fù)雜,而且存在會話時間限制
短信:眾多短信網(wǎng)關(guān)收費不同、穩(wěn)定性也不確定,需要通過API接入
3.傳統(tǒng)告警 VS OneAlert在整個使用過程中,得出了傳統(tǒng)告警方式的不足以及給個了 OneAlert 告警的功能,具體如下:
3.1 傳統(tǒng)告警方式的不足Zabbix 郵件告警經(jīng)常發(fā)不出去
如需短信告警,要么購買短信貓要么購買短信 API,整個流程太麻煩
微信告警需要申請公眾號以及 API 接入,而且會話有時間限制
夜間的告警基本成為一個擺設(shè),試問誰能被微弱的短信聲叫醒
阿里云、騰訊云、Zabbix 各種系統(tǒng)告警都需要多帶帶配置,工作繁瑣
普遍缺少告警分析
139/189 發(fā)送告警存在明顯的延遲
3.2 OneAlert告警功能告警 All In One,支持微信、郵箱、短信、APP、電話告警
支持接入 Zabbix、Nagios、阿里云、騰訊云、監(jiān)控寶等等告警信息
靈活的分配策略,可靈活的分配告警信息發(fā)送給相關(guān)人員
微信、郵箱、app 等告警方式全部免費
4.接入準(zhǔn)備由于 Zabbix 官方已經(jīng)升級到zabbix-3.0.0alpha,考慮到未來的趨勢,我也迫不及待的升級到了 3.0,除了 Web 風(fēng)格變化,大部分都差不多。所以本文適用于 Zabbix2.x 與 Zabbix3.x 版本。接下來跟著涼白開將 OneAlert 接入 Zabbix,如有任何疑問或者不足,歡迎加群或者在 ttlsa.com 留言一起交流!
5. OneAlert 后臺操作 5.1 設(shè)置提醒郵件,短信,微信,電話提醒,多策略提醒,如下圖,靈活的定義告警規(guī)則。在發(fā)生告警之后立即發(fā)送郵件和微信消息給用戶,10分鐘后還未確認(rèn),那么發(fā)送短信,30分鐘還未確認(rèn)則打電話給用戶。
5.2 設(shè)置分派策略可以設(shè)定做種分派策略,在告警第一時間發(fā)送通知給哪些人,如果在 30 分鐘還未處理好,可以將消息發(fā)送給上級主管人員,如下圖
5.3 創(chuàng)建應(yīng)用登陸 OneAlert 后臺,點擊告警 -> 應(yīng)用 -> 新增應(yīng)用,集成類型包含阿里、Nagios、騰訊云等多種,我們選擇 Zabbix 最后保存即可。將會生成應(yīng)用 KEY,Key 在后面將會被用到!
6.安裝onealert agent#cd /usr/local/src/ # wget http://cdn.110monitor.com/open/download/alert-agent-4.0.1-RC2.tar.gz # tar –xvf alert-agent-4.0.1-RC2.tar.gz(注意:參數(shù)為-xvf,不是-xzvf) # cp -rp alert-agent /usr/local/zabbix-3.0.0/alertscripts # cd /usr/local/zabbix-3.0.0/alertscripts # cp alert-agent/plugin/zabbix-plugin/110monitor . # chmod +x ./110monitor7. Zabbix 集成OneAlert
以下操作均在 Zabbix Web 后臺完成
7.1 創(chuàng)建 OneAlert 媒介administration->Media Types->create media type,如下圖
7.2 Admin 用戶添加 OneAlert 媒介Administration->Users->Admin->點擊media->Add,輸入如下:send to 為 OneAlert 后臺生成的 key
點擊Configuration->Action->create action
主題為trigger和resolve,意味著告警觸發(fā)和恢復(fù)都會同步到 110monitor
設(shè)置告警內(nèi)容,注意冒號「:」前的內(nèi)容不可變更,冒號「:」后的內(nèi)容可以自行編輯,只能使用以下7調(diào)告警信息,否則告警無法發(fā)送至 OneAlert 接口
`alarmName:{TRIGGER.NAME}` `entityName:{HOSTNAME}` ` entityId:{IPADDRESS}` `value:{TRIGGER.VALUE}` ` eventId:{EVENT.ID}` `priority:{TRIGGER.SEVERITY}` `alarmContent:{IPADDRESS} ` `{ITEM.NAME}:{ITEM.VALUE}`8. Zabbix + OneAlert 集成測試
來制造一個故障,選定一臺 Zabbix 客戶端,執(zhí)行如下命令:
# killall zabbix_agentd
等候五分鐘,OneAlert 后臺有如下告警
并且也收到了微信(需要關(guān)注公眾號,并且綁定賬號)和短信告警
9. OneAlert 告警分析提供了一份 Zabbix 等開源監(jiān)控都沒有的告警信息分析,運維能清晰的掌握最近服務(wù)器狀態(tài)
10. 總結(jié)OneAlert與Zabbix的集成就說到這,如有任何疑問或者不足,歡迎加群或者在 ttlsa.com 留言一起交流!
作者:涼白開 網(wǎng)址:http://www.ttlsa.com
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/7926.html
摘要:也有幸和全球說運維負(fù)責(zé)人李云偉先生進行一次深入溝通。面臨挑戰(zhàn)全球說的應(yīng)用主要是在線系統(tǒng)和移動為主。是北京科技有限公司旗下產(chǎn)品,中國首個模式的,集成國內(nèi)外主流監(jiān)控支撐系統(tǒng),實現(xiàn)一個平臺上集中處理所有事件,提升可靠性。 客戶背景 「全球說」 Talkmate,是北京酷語時代教育科技有限公司(酷語科技)旗下產(chǎn)品,酷語科技是一家誕生于中國的語言技術(shù)公司,致力于為全球用戶提供一個全新的多語言學(xué)習(xí)...
摘要:告警關(guān)聯(lián)唯一使監(jiān)控和報警都步入正軌的好辦法,就是通過告警關(guān)聯(lián)。企業(yè)如果適應(yīng)了告警關(guān)聯(lián),信息告警的圖表盤上確實能減少很多壓力。 上節(jié)回顧 對于許多 IT 和運維團隊來說,Nagios 既是一個福音也是一個詛咒。一方面,Naigos 在 IT 應(yīng)用的工作領(lǐng)域中,給予了你可以實時查看告警數(shù)據(jù)的可能性;但是另一方面,Nagios 也能夠生成超級多的告警,對于任何一個運維人員或是運維團隊來說都是...
摘要:如何有效處理緊急事件驅(qū)動的工作,成為特別是運維主管運維工作的關(guān)鍵。通知到位和及時響應(yīng)。機器學(xué)習(xí)領(lǐng)域是未來的重要發(fā)展方向,目前我們還在摸索中。機器學(xué)習(xí)告警合并事件單的處理如果告警量很大,告警后續(xù)處理和跟蹤往往會依賴于外部團隊部門外或公司外。 編者按]本文作者為陳伯龍,云告警平臺[OneAlert創(chuàng)始人,著《云計算與OpenStack》,在IT運營管理、云計算方面從業(yè)10多年。 正文 互聯(lián)...
摘要:如何有效處理緊急事件驅(qū)動的工作,成為特別是運維主管運維工作的關(guān)鍵。通知到位和及時響應(yīng)。機器學(xué)習(xí)領(lǐng)域是未來的重要發(fā)展方向,目前我們還在摸索中。機器學(xué)習(xí)告警合并事件單的處理如果告警量很大,告警后續(xù)處理和跟蹤往往會依賴于外部團隊部門外或公司外。 編者按]本文作者為陳伯龍,云告警平臺[OneAlert創(chuàng)始人,著《云計算與OpenStack》,在IT運營管理、云計算方面從業(yè)10多年。 正文 互聯(lián)...
摘要:作為骨灰級粉絲,一直以來對第三方監(jiān)控都是拒絕的。例如白屏?xí)r間首屏?xí)r間腳本錯誤網(wǎng)頁加載就緒時間各種瀏覽器的訪問情況,甚至能了解不同瀏覽器運營商地區(qū)用戶的訪問狀況。腳本錯誤在所難免,錯誤進一步導(dǎo)致網(wǎng)站部分功能無法使用。 作為 Zabbix 骨灰級粉絲,一直以來對第三方監(jiān)控(APM)都是拒絕的。一來覺得收費,二來擔(dān)心數(shù)據(jù)被人所知,三來覺得 Zabbix 牛逼到無可取代。但是,隨著 APM 市...
閱讀 3107·2021-11-02 14:40
閱讀 889·2019-08-30 15:53
閱讀 1343·2019-08-30 15:53
閱讀 3316·2019-08-30 13:53
閱讀 3375·2019-08-29 12:50
閱讀 1194·2019-08-26 13:49
閱讀 1928·2019-08-26 12:20
閱讀 3726·2019-08-26 11:33