百度是中國互聯(lián)網(wǎng)規(guī)模最大的公司之一。業(yè)內(nèi)很多人都會(huì)好奇,百度是怎么做運(yùn)維的?接下來讓我們一起重溯百度運(yùn)維之路。百度運(yùn)維誕生于2008年,截至目前共打造了三代運(yùn)維平臺(tái),百度的運(yùn)維技術(shù)也經(jīng)歷了web化、開放化、智能化三個(gè)階段。2014年,百度運(yùn)維在行業(yè)率先提出智能運(yùn)維理念,百度智能運(yùn)維(IOP)團(tuán)隊(duì)也應(yīng)運(yùn)而生。
我們一方面,希望將百度成熟的運(yùn)維理念和運(yùn)維技術(shù),轉(zhuǎn)化成通用化的運(yùn)維產(chǎn)品,服務(wù)于百度云的客戶;另一方面,持續(xù)探索AIOps領(lǐng)域,逐漸形成完整的智能化運(yùn)維解決方案,落地到百度內(nèi)外的業(yè)務(wù)和產(chǎn)品,形成自動(dòng)+智能的理想運(yùn)維模式。最終,兩相結(jié)合,助力業(yè)務(wù)達(dá)成高質(zhì)量、高效率、低成本的運(yùn)維目標(biāo)。
本篇主要介紹百度對(duì)運(yùn)維、自動(dòng)化運(yùn)維的理解與百度自動(dòng)化運(yùn)維評(píng)價(jià)標(biāo)準(zhǔn),下篇?jiǎng)t根據(jù)時(shí)間脈絡(luò)介紹百度的三代運(yùn)維平臺(tái)。
注:本文所討論范圍特指互聯(lián)網(wǎng)服務(wù)的運(yùn)維——應(yīng)用運(yùn)維,而非 IT 系統(tǒng)、IDC 等的運(yùn)維。
什么是運(yùn)維?
運(yùn)維,從字面來看,可以將運(yùn)維分為兩部分:
1運(yùn):一般的理解是運(yùn)行,將服務(wù)運(yùn)轉(zhuǎn)起來,以滿足用戶和客戶的需求;進(jìn)一步的含義還有運(yùn)籌,即統(tǒng)籌安排資源,提供最優(yōu)解決方案,以達(dá)到效益最大化。
2維:一般的理解是維護(hù),維持并監(jiān)護(hù)服務(wù)的運(yùn)行過程,包括應(yīng)對(duì)服務(wù)管理請(qǐng)求和事件;進(jìn)一步的含義還有維系,或者說連接,特指其起到的承上啟下和樞紐作用。
百度百科給出了非常明確的定義:其核心目標(biāo)是將交付的業(yè)務(wù)軟件和硬件基礎(chǔ)設(shè)施高效合理的整合,轉(zhuǎn)換為可持續(xù)提供高質(zhì)量服務(wù)的產(chǎn)品,同時(shí)最大限度降低服務(wù)運(yùn)行的成本,保障服務(wù)運(yùn)行的安全。
在百度,我們對(duì)運(yùn)維的理解,簡單概括就是:確保大家高質(zhì)量、高效率、低成本地運(yùn)行和維護(hù)自己的服務(wù)和產(chǎn)品。
什么是自動(dòng)化運(yùn)維?
什么是自動(dòng)化運(yùn)維,答案有很多。這里,我嘗試從另外一個(gè)角度,什么不是自動(dòng)化,來嘗試回答下。
自動(dòng)化是達(dá)成目標(biāo)的手段
首先,自動(dòng)化不是運(yùn)維的最終目標(biāo),而是達(dá)成目標(biāo)的手段;通過自動(dòng)化我們可以提高服務(wù)的可用性,可以加速服務(wù)的迭代,可以降低服務(wù)運(yùn)行所花銷的成本。
自動(dòng)化是解決方案和工程
其次,自動(dòng)化不是將運(yùn)維人員的工作、行為進(jìn)行簡單封裝和串聯(lián);而是通過總結(jié)、提煉、抽象形成的系統(tǒng)化的解決方案和工程(Engineering)。
自動(dòng)化實(shí)現(xiàn)方法是多樣的
再次,自動(dòng)化的實(shí)現(xiàn)方法,不是一成不變的:一方面,我們運(yùn)維的服務(wù)、我們支持的產(chǎn)品和用戶都在不斷變化(這就是互聯(lián)網(wǎng)?。?;另一方面,我們的自動(dòng)化實(shí)施對(duì)象也在隨技術(shù)能力的發(fā)展而不斷演進(jìn)(從自動(dòng)化執(zhí)行命令、到自動(dòng)化感知故障、再到自動(dòng)化決策規(guī)劃)。
實(shí)踐歷程
百度運(yùn)維,于2008年正式確立,而百度的運(yùn)維工程師這個(gè)職位,出現(xiàn)得更早些(大概在2004年~2005年),從一開始,百度運(yùn)維就在朝著自動(dòng)化這個(gè)方向努力。
百度自動(dòng)化運(yùn)維標(biāo)準(zhǔn)
接下來給大家介紹的內(nèi)容,是結(jié)合了我們多年的實(shí)踐經(jīng)驗(yàn),并參考了 SAE(美國汽車工程師協(xié)會(huì))針對(duì)自動(dòng)駕駛所定義的分級(jí)標(biāo)準(zhǔn)得來的自動(dòng)化運(yùn)維分級(jí)標(biāo)準(zhǔn)。
我們也將其分成了 L1~L5 共 5 個(gè)層級(jí),不同層級(jí)間的區(qū)別主要體現(xiàn)在如下 4 個(gè)方面的職能是人工還是運(yùn)維系統(tǒng)實(shí)現(xiàn)的:
執(zhí)行能力(Execution) 這很容易理解,將指令發(fā)送到目的端(服務(wù)器、設(shè)備等)執(zhí)行并獲得執(zhí)行結(jié)果。執(zhí)行能力是否由系統(tǒng)完成,是最基本的自動(dòng)化要求,將其定義為 L1(工具輔助的自動(dòng)化) ~ L2(部分自動(dòng)化)。
感知能力(Perception) 包括感知服務(wù)的運(yùn)行狀態(tài),感知服務(wù)的變更需求甚至故障事件,也可以稱作理解。感知能力由系統(tǒng)完成后,結(jié)合一些固定的條件規(guī)則來決策并執(zhí)行,可以達(dá)成 L3(有條件的自動(dòng)化)。
規(guī)劃能力(Planning) 根據(jù)其對(duì)待處理的需求、待解決的問題的感知,以及對(duì)運(yùn)維對(duì)象的認(rèn)知(知識(shí)),自主做出解決方案(規(guī)劃)并在調(diào)度控制執(zhí)行過程中,根據(jù)目標(biāo)和運(yùn)維對(duì)象的狀態(tài)反饋來適時(shí)調(diào)整執(zhí)行規(guī)劃。規(guī)劃能力由系統(tǒng)完成后,并由系統(tǒng)輔助人來進(jìn)行知識(shí)、經(jīng)驗(yàn)的沉淀以補(bǔ)充系統(tǒng)的擴(kuò)展性,可以處理全部人類已知的運(yùn)維工作,即 L4(高度自動(dòng)化)。從 AI 角度看,可以認(rèn)為到了這個(gè)層次的自動(dòng)化運(yùn)維系統(tǒng)具有了一定的弱人工智能。
主動(dòng)學(xué)習(xí)能力(Proactive Learning) 主要指的是不依賴人,系統(tǒng)可以自行總結(jié)、提煉、抽象形成知識(shí)和經(jīng)驗(yàn)的能力。至此,全部的運(yùn)維工作都可以交由自動(dòng)化運(yùn)維系統(tǒng)處理了,即 L5(完全自動(dòng)化)。從 AI 角度看,可以認(rèn)為到了這個(gè)層次,稱之為強(qiáng)人工智能了。
從全局視角審視自動(dòng)化運(yùn)維的若干層次及其之間的關(guān)系,可以得到下面這張表格:
【版權(quán)聲明】:本站內(nèi)容來自于與互聯(lián)網(wǎng)(注明原創(chuàng)稿件除外),供訪客免費(fèi)學(xué)習(xí)需要。如文章或圖像侵犯到您的權(quán)益,請(qǐng)及時(shí)告知,我們第一時(shí)間刪除處理!謝謝!