高(gāo)效數(shù)據中心運維團隊的(de)7個(gè)習慣
作者:admin  來源:本站  發表時間:2016-1-5  點擊:4213

       在(zài)好(hǎo)(hǎo)萊塢大片《星際穿越》中,墨菲定律的(de)旋律無處不(bù)在(zài):“會(huì)出錯的(de)事總會(huì)出錯-Anything that can go wrong , will go wrong。”數(shù)據中心基礎設施的(de)運維團隊,面臨著(zhe)同樣的(de)挑戰:如何運行(xíng)一個(gè)龐雜的(de)機房(fáng),進行(xíng)無數(shù)的(de)主動和被動的(de)操作,同時避免錯誤導緻的(de)數(shù)據中心故障。全球行(xíng)業專家們都認可:通過一系列的(de)努力,可以最大程度控制潛在(zài)故障的(de)影響範圍,保證數(shù)據中心最高(gāo)效穩定的(de)運行(xíng)。

  Steve Covey為(wèi)高(gāo)效人士總結了7個(gè)習慣。我(wǒ)們基于對行(xíng)業最佳實踐的(de)觀察,總結了高(gāo)效數(shù)據中心運維團隊的(de)7個(gè)習慣。

  1. 以終為(wèi)始

  以終為(wèi)始是一種以結果為(wèi)導向的(de)思維方式,提示人們在(zài)做(zuò)事情前要先明确做(zuò)事情的(de)最終目的(de),也就是“不(bù)忘初心,方得始終”。數(shù)據中心的(de)終極目标是支持業務(wù)系統的(de)不(bù)間斷運行(xíng)。在(zài)接手一個(gè)數(shù)據中心的(de)運維任務(wù)之前,我(wǒ)們首先需要明确業務(wù)連續性目标,然後才能制定相應的(de)運維策略。

  2. 以人為(wèi)本

  70%的(de)數(shù)據中心故障是由人為(wèi)造成的(de)。與此同時,即使有最先進的(de)監控系統,數(shù)據中心內(nèi)無論主動保養操作,還是應急反應,都還需要依賴于人員的(de)最終決策和操作。所以,配備足夠的(de)人員、有責任心、經驗豐富的(de)人員、對于數(shù)據中心的(de)安全運行(xíng)至關重要。

  3. 培訓與學(xué)習

  學(xué)習是一種修煉。有一種說(shuō)法“最好(hǎo)(hǎo)的(de)運維團隊隻不(bù)過是犯了足夠的(de)錯誤就修煉出來的(de)”。數(shù)據中心基礎設施牽涉到電力、暖通、弱電、消防、建築等諸多專業,對于數(shù)據中心運維團隊來說(shuō),需要學(xué)習的(de)專業知識非常多。同時,每一個(gè)數(shù)據中心的(de)配置和特定的(de)操作流程都不(bù)完全相同。因此,培訓與學(xué)習應該成為(wèi)運維 團隊管理(lǐ)的(de)一個(gè)重要組成部門(mén)。

  4. 建立管理(lǐ)體系

  數(shù)據中心基礎設施的(de)運維管理(lǐ)工作的(de)管理(lǐ)對象包括整個(gè)龐大的(de)基礎設施、運維團隊、服(fú)務(wù)對象(IT部門(mén)或者IDC客戶),是一項系統性很強的(de)工作,需要建立起一個(gè)管理(lǐ)體系。在(zài)整個(gè)管理(lǐ)體系中最重要的(de)三個(gè)方面是設備保養體系、與所有相關部門(mén)的(de)溝通機制、以及支持整個(gè)數(shù)據中心生命周期管理(lǐ)的(de)财務(wù)預算體系。

  5. 規範操作流程

  任何規範化(huà)(huà)的(de)企業管理(lǐ),都不(bù)可避免地(dì)需要引入流程,數(shù)據中心運維管理(lǐ)也不(bù)例外。完全基于個(gè)人經驗和判斷的(de)操作,往往隐藏著(zhe)重大的(de)故障風險。數(shù)據中心就是要強化(huà)(huà)流程管理(lǐ)。任何重要的(de)操作,必須嚴格按照(zhào)流程執行(xíng)。建立流程文化(huà)(huà)是數(shù)據中心規範化(huà)(huà)管理(lǐ)的(de)一個(gè)重要環節。數(shù)據中心最重要的(de)三類流程是标準操作流程(SOP),維護保養操作流程(MOP),和應急相應流程(EOP)。

  6. 動态管控

  除了之前提到的(de)管理(lǐ)體系和操作流程這(zhè)些相對靜(jìng)态的(de)工作以外,數(shù)據中心還需要進行(xíng)動态的(de)管控。近(jìn)幾年,IT負載的(de)動态性表現得越來越明顯。一方面,IT設備的(de)增加速度比較快。新(xīn)的(de)業務(wù)系統上線可能導緻IT負載在(zài)短期內(nèi)有較大的(de)增加。另一方面,企業大量采用(yòng)虛拟化(huà)(huà)技術以後,可能會(huì)出現機房(fáng)內(nèi)各機櫃的(de)IT負載在(zài)一天範圍內(nèi)有較大變化(huà)(huà)的(de)情況。基礎設施運維團隊需要針對這(zhè)種IT負載的(de)動态性作出相應的(de)對策。

  7. 持續改善

  大型數(shù)據中心的(de)出現隻是近(jìn)幾年的(de)事情。當數(shù)據中心超過一定規模的(de)時候,管理(lǐ)變得複雜,已經超越原來簡單的(de)依賴于少數(shù)運維人員的(de)責任心的(de)時代,需要的(de)是完整的(de)管理(lǐ)思想和方法論。國內(nèi)數(shù)據中心基礎設施運維體系的(de)成熟度大緻處于三個(gè)等級的(de)狀态:基礎級、成長(cháng)級、文化(huà)(huà)級。

掃描二維碼添加昊雲公衆訂閱号

掃描二維碼添加昊雲公衆服(fú)務(wù)号

服(fú)務(wù)項目

維保運維服(fú)務(wù)

信息系統集成服(fú)務(wù)

機房(fáng)搬遷服(fú)務(wù)

 
 
 
QQ 在(zài)線客服(fú)
QQ 在(zài)線客服(fú)
 
電話:
0531-88818533
客服(fú)QQ
2061058957
1905215487