亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

告警分析:如何幫助運維團(tuán)隊快速做出最佳決策?

pumpkin9 / 904人閱讀

摘要:健全的告警分析體系真正認(rèn)識你的團(tuán)隊好的告警分析機(jī)制能夠幫助管理者分析團(tuán)隊整體的工作情況,根據(jù)作為評判標(biāo)準(zhǔn)。根據(jù)告警內(nèi)容分析也是很有必要的,能夠幫助團(tuán)隊管理者對資源進(jìn)行適當(dāng)?shù)恼{(diào)整,工作重心的調(diào)整。

「路漫漫其修遠(yuǎn)兮,吾將上下而求索」,「轉(zhuǎn)身」不見得華麗,但我必須「轉(zhuǎn)身」,不要安逸于現(xiàn)在的運維狀況。

如果你運維一線人員,是否會遇到以下情況:

公司所有的服務(wù)器告警消息會塞滿自己的整個郵箱,如果公司的運維團(tuán)隊有幾個人到幾十人不等,當(dāng)你處理郵箱中的告警消息的時候,處理一半會發(fā)現(xiàn)問題已經(jīng)解決了,這個現(xiàn)象很常見,會導(dǎo)致工作效率的下降。改善的方法有很多,比如團(tuán)隊內(nèi)部多一些溝通,然而溝通的成本也是非常高的。解決問題應(yīng)該從源頭出發(fā),治標(biāo)不治本的方法還是應(yīng)該適當(dāng)采取。也許你在創(chuàng)業(yè)團(tuán)隊工作,團(tuán)隊中只有一個人,但是也希望你能讀完本篇文章,等團(tuán)隊壯大之后也會有幫助!

單一的告警通知方式會麻木運維同學(xué)的工作思維,一天 24 小時接收的都是郵件或者短信的告警通知。我們更希望白天工作時間使用郵件、微信、APP 等輕量級的通知方式,晚上休息時間使用短信、電話等偏重的通知方式。這樣不僅白天能夠提高工作效率,而且能夠晚上好好休息,不用擔(dān)心告警疏漏。如果能有排班通知,那么就真正能「睡個好覺」了。
如果你是運維 Team Leader,是否會遇到以下情況:

如果你是團(tuán)隊的管理人員,是否會遇到以下情況:

團(tuán)隊一直在解決故障,但對系統(tǒng)性能沒有整體的把握;你對團(tuán)隊、成員的工作量,工作效率沒有全面的了解。你肯定不希望這樣管理你的團(tuán)隊,不希望團(tuán)隊重復(fù)解決某些事情,更不希望因為這些問題讓團(tuán)隊士氣低落,覺得工作沒有干勁。

團(tuán)隊一直在重復(fù)解決某一故障,但是卻因為缺少一個好的分析工具,導(dǎo)致無用功重復(fù)執(zhí)行。比如經(jīng)常收到「127.0.0.1」服務(wù)器內(nèi)存使用率超過90%,嚴(yán)重級別高’的告警消息,通過對告警消息分析,此告警消息在本月出現(xiàn)頻率最高,此時是否能夠根據(jù)此告警對服務(wù)器做出一些硬件上的調(diào)整來減少告警的噪聲?

解決以上可能出現(xiàn)的問題,你需要:

合適通知體系

合理的通知方式

健全的告警分析機(jī)制

合適的通知體系 ------- 你的鍋你來背

根據(jù)不同的主機(jī)組把告警發(fā)給不同的一線成員,可有效解決告警分派的問題,并且能夠使團(tuán)隊責(zé)任劃分清晰。每個人負(fù)責(zé)一部分服務(wù)器,出現(xiàn)問題之后,告警消息只會通知自己,避免對其他同事的工作造成干擾。那如果這位同事遺漏了告警怎么辦?告警消息不被團(tuán)隊的其他人知曉,解決時間會存在嚴(yán)重的問題。這時需要一個有效的升級機(jī)制,告警在設(shè)置時間內(nèi)不確認(rèn)、不解決的時候,會升級到二線值班人員,二線一般都是領(lǐng)導(dǎo)級別的了,如果告警真的升級了,那你就…………。所以在第一時間接收到告警消息,第一時間解決掉是非常關(guān)鍵的,這時我們就需要有多種通知方式,合理的通知方式。

合理的通知方式 ------- 對的時間遇上對的人

不要在錯的時間遇上對的人。 當(dāng)告警消息來了,選擇一個好的通知方式是至關(guān)重要的。比如白天工作時間,告警消息的推送只需要通過微信、郵件的方式。而晚上下班時間休息時間,告警消息推送可以選擇短信和電話兩種方式進(jìn)行通知,靈活的通知方式能夠達(dá)到事半功倍的效果。告警通知很及時,那怎么衡量團(tuán)隊的工作效率、個人的工作效率呢?根據(jù)什么標(biāo)準(zhǔn)來衡量呢?這時有一個健全告警分析機(jī)制是很關(guān)鍵的。

健全的告警分析體系 ------- 真正認(rèn)識你的團(tuán)隊

好的告警分析機(jī)制能夠幫助管理者分析團(tuán)隊整體的工作情況,根據(jù) MTTR 作為評判標(biāo)準(zhǔn)。通過告警分析能夠分析出某一告警應(yīng)用某段時間內(nèi)處理情況。

根據(jù)告警內(nèi)容分析也是很有必要的,能夠幫助團(tuán)隊管理者對資源進(jìn)行適當(dāng)?shù)恼{(diào)整,工作重心的調(diào)整。

當(dāng)然對團(tuán)隊成員的工作進(jìn)行分析也是非常有必要的,OneAlert 對成員處理告警的分析即將上線。

健全的告警分析是一個運維管理團(tuán)隊必須的,我們能夠在其中發(fā)現(xiàn)很多的團(tuán)隊問題,然后進(jìn)行適當(dāng)?shù)恼{(diào)整,把團(tuán)隊的整體 KPI 提高,士氣提高!希望本篇文章能夠?qū)δ阌杏谩?/p>

OneAlert 是北京藍(lán)海訊通科技有限公司旗下產(chǎn)品,中國首個 SaaS 模式的云告警平臺,集成國內(nèi)外主流監(jiān)控/支撐系統(tǒng),實現(xiàn)一個平臺上集中處理所有IT事件,提升IT可靠性。想了解更多信息,請訪問 OneAlert 官網(wǎng) 。
本文轉(zhuǎn)自 OneAPM 官方博客

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/7961.html

相關(guān)文章

  • AIOps在攜程的踐行

    摘要:隨著人工智能時代的到來,攜程生產(chǎn)環(huán)境運維進(jìn)入了新的運維時代。本文選取了幾種典型的運維場景對在攜程的踐行展開了介紹,首先讓我們從概念認(rèn)識下。針對應(yīng)用異常指標(biāo)檢測這種場景,抽取一定的樣本統(tǒng)計,在基于專家經(jīng)驗標(biāo)注下的準(zhǔn)確率可達(dá)到以上,召回率接近。 作者簡介徐新龍,攜程技術(shù)保障中心應(yīng)用管理團(tuán)隊高級工程師,負(fù)責(zé)多個AIOps項目的設(shè)計與研發(fā)。信號處理專業(yè)碩士畢業(yè),對人工智能、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)及數(shù)學(xué)有...

    MingjunYang 評論0 收藏0
  • 運維不容錯過的4個關(guān)鍵指標(biāo)!

    摘要:平均解決事件解決時間是衡量業(yè)務(wù)準(zhǔn)備的最佳標(biāo)準(zhǔn)。平均每小時折合損失。說明整個團(tuán)隊的響應(yīng)及時率是不錯的。小結(jié)致力減少告警數(shù)量及時響應(yīng)如果不能及時響應(yīng),能夠升級處理,最終提升解決時間,個核心關(guān)鍵指標(biāo)是運維支撐工作非常關(guān)鍵的指標(biāo)。 很難說,生活在這個數(shù)據(jù)大爆炸的時代對運維同學(xué)是福還是禍。靈活的監(jiān)控系統(tǒng)、開放 API 和易用的數(shù)據(jù)可視化資源可以將任何想要的數(shù)據(jù)圖表化地顯示出來,但是,過多的數(shù)據(jù)容...

    xiaodao 評論0 收藏0
  • 對抗不可執(zhí)行告警的四種措施

    摘要:例如,把提示無效信用卡賬號的告警替換為一個可執(zhí)行的告警,比如指示用戶支付成功率急劇下降的告警可能系統(tǒng)會做出較大的變化,需要回滾操作。因此,不斷完善告警也是同樣非常重要的,所以要養(yǎng)成定期瀏覽和刪除不可執(zhí)行告警的習(xí)慣。 對于運維團(tuán)隊而言,很多告警其實并不能幫助他們解決掉實際的問題,相反有時會加重多余的負(fù)擔(dān),這主要是因為大多數(shù)的告警并不具備足夠的可執(zhí)行性: 它們指出的問題壓根兒不需要響應(yīng) ...

    zacklee 評論0 收藏0
  • 活動實錄 | 京東金融PE談如何顛覆應(yīng)用運維認(rèn)知

    摘要:導(dǎo)讀為數(shù)人云系列活動專題,本文是月日北京站線下活動當(dāng)西方的遇上東方的互聯(lián)網(wǎng)中京東金融王超老師的分享。王超京東金融企業(yè)高級目前在京東金融平臺負(fù)責(zé)一個人左右的應(yīng)用運維團(tuán)隊團(tuán)隊,也曾負(fù)責(zé)人人網(wǎng)團(tuán)隊。 導(dǎo)讀:[GO SRE!] 為數(shù)人云SRE系列活動專題,本文是3月4日北京站線下活動當(dāng)西方的SRE遇上東方的互聯(lián)網(wǎng)中京東金融王超老師的分享。 他將從SRE,Devops, PE間的關(guān)系開始,介紹企...

    劉永祥 評論0 收藏0
  • 活動實錄 | 京東金融PE談如何顛覆應(yīng)用運維認(rèn)知

    摘要:導(dǎo)讀為數(shù)人云系列活動專題,本文是月日北京站線下活動當(dāng)西方的遇上東方的互聯(lián)網(wǎng)中京東金融王超老師的分享。王超京東金融企業(yè)高級目前在京東金融平臺負(fù)責(zé)一個人左右的應(yīng)用運維團(tuán)隊團(tuán)隊,也曾負(fù)責(zé)人人網(wǎng)團(tuán)隊。 導(dǎo)讀:[GO SRE!] 為數(shù)人云SRE系列活動專題,本文是3月4日北京站線下活動當(dāng)西方的SRE遇上東方的互聯(lián)網(wǎng)中京東金融王超老師的分享。 他將從SRE,Devops, PE間的關(guān)系開始,介紹企...

    DevTTL 評論0 收藏0

發(fā)表評論

0條評論

pumpkin9

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<