數(shù)據中心運維工作的(de)提升技巧
作者:蟻巡 IT168  來源:本站  發表時間:2016-2-23  點擊:3375

      數(shù)據中心的(de)穩定運行(xíng)離(lí)不(bù)開數(shù)據中心的(de)運維人員,而數(shù)據中心運維的(de)工作涉及到方方面面,它不(bù)同于其它的(de)運維,處理(lǐ)的(de)問題都是比較專業的(de)問題。在(zài)很多的(de)公司(sī)都是将服(fú)務(wù)器(qì)和設備托管到專門(mén)的(de)數(shù)據中心機房(fáng)讓專業的(de)人士進行(xíng)維護,隻有一些技術實力比較強的(de)大公司(sī)才建設有自己的(de)數(shù)據中心。如今的(de)信息技術更新(xīn)得很快,什麼大數(shù)據、雲計(jì)算、虛拟化(huà)(huà)、綠色數(shù)據 中心等等新(xīn)技術層出不(bù)窮,各種設備的(de)CPU內(nèi)存、轉發芯片等也都在(zài)不(bù)斷地(dì)發展。

      從單核CPU到多核、四核、八核、十六核、三十二核,網絡單端口帶寬從10M、100M、1G、10G、100G,這(zhè)些技術的(de)進步給數(shù)據中心帶來了高(gāo)速的(de)信息處理(lǐ)能力,但(dàn)是也讓這(zhè)個(gè)數(shù)據中心的(de)系統變得異常複雜,傳統的(de)數(shù)據中心運維技能已經難以适應信息高(gāo)速發展的(de)需要了,需要我(wǒ)們去不(bù)斷學(xué)習,提升自己,才能在(zài)未來的(de)數(shù)據中心裡(lǐ),将運維的(de)工作開展好(hǎo)(hǎo)。下面将結合一些實際工作經驗講述提升運維技能的(de)一些方法。

      數(shù)據中心是一個(gè)複雜的(de)信息處理(lǐ)系統,包括系統、網絡、存儲、協議(yì)、需求、開發、測試、安全、空調、供電、監控等多個(gè)環節,運維的(de)工作就是要包含到所有這(zhè)些方面,可見運維的(de)工作是一個(gè)集多IT工種技能于一身(shēn)的(de)崗位。然而這(zhè)裡(lǐ)說(shuō)的(de)每一個(gè)部分都需要多種技術學(xué)科(kē)的(de)支撐,比如系統可能有Linux、Windows的(de),應用(yòng)有LVS、HA、WebServer、DB、中間件(jiàn),網絡就更複雜了,各種二三層協議(yì),虛拟化(huà)(huà),環路(lù)協議(yì),路(lù)由協議(yì)等等。這(zhè)麼多的(de)技術不(bù)可能每個(gè)人都精通,不(bù)可否認可能有這(zhè)種全面精通的(de)人存在(zài),但(dàn)人的(de)精力畢竟是有限的(de),要有所得也要有所失。首先是溝通能力、團隊協作。運維的(de)工作涉及跨部門(mén)、跨工種特别多,這(zhè)樣運維的(de)人員需要善于溝通,團隊協議(yì)能力要強,這(zhè)樣在(zài)處理(lǐ)問題時,可以充分調用(yòng)各種資(zī)源和技術力量,迅速解決問題。

      對于數(shù)據中心時間就是利潤,流量就是金錢(qián),一年365天要保持數(shù)據中心的(de)穩定運行(xíng),不(bù)出故障或者少出故障才行(xíng)。當業務(wù)部門(mén)反饋有故障時,根據反饋的(de)故障現象迅速鎖定故障點,然後集中資(zī)源解決,這(zhè)其中需要大量的(de)溝通,有效的(de)溝通将為(wèi)排除故障節省下來大量時間。其次是運維工作要膽大心細。膽大才能創新(xīn),不(bù)走尋常路(lù)。即使數(shù)據中心再小,它也有自己的(de)特點,充分利用(yòng)它的(de)優勢,才能發揮出數(shù)據中心最大的(de)效能。數(shù)據中心本來就是一個(gè)技術更新(xīn)很快的(de)領域,願意接受新(xīn)事物(wù),大膽引入先進運維的(de) 技術将可以大大提升數(shù)據中心的(de)工作效率。再次是做(zuò)好(hǎo)(hǎo)日常監控工作,一個(gè)健壯的(de)身(shēn)體離(lí)不(bù)開每天的(de)觀察,我(wǒ)們需要時時刻刻觀察我(wǒ)們的(de)數(shù)據中心,看看數(shù)據中心發生的(de)細小問題。每天都要對數(shù)據中心的(de)所有方面運行(xíng)參數(shù)進行(xíng)全面檢查和記錄,慢慢地(dì)就會(huì)對數(shù)據中心運行(xíng)狀态有了掌握,當某些參數(shù)變化(huà)(huà)時及時做(zuò)應對之策。比如設備運行(xíng)的(de)CPU占用(yòng)率,平時監控所有設備CPU占用(yòng)率都在(zài)30%左右,突然有一天幾台設備的(de)CPU占用(yòng)率無緣無故升到了60%,這(zhè)就需要進一步檢查升高(gāo)的(de)原因,直到消除掉為(wèi)止。如果沒有這(zhè)些平日裡(lǐ)的(de)統計(jì)記錄,這(zhè)樣的(de)參數(shù)變化(huà)(huà)就不(bù)會(huì)引起人們的(de)注意,故障遲早會(huì)到來。第四做(zuò)好(hǎo)(hǎo)統計(jì)工作。一般的(de)數(shù)據中心都擁有上千台的(de)服(fú)務(wù)器(qì)設備,還有其它不(bù)少的(de)電子(zi)設備,要做(zuò)好(hǎo)(hǎo)統計(jì)工作。比如服(fú)務(wù)器(qì)多少台,都處于什麼位置,都和網絡設備如何互連的(de),每台設備的(de)配置,應用(yòng)的(de)特性等等,這(zhè)些統計(jì)工作馬虎不(bù)得,都關系著(zhe)數(shù)十萬設備的(de)物(wù)理(lǐ)安全。在(zài)平日接觸到的(de)運維人員讓我(wǒ)們感受到不(bù)同的(de)人員對自己數(shù)據中心的(de)了解差異是非常大的(de),有的(de)人可以對詢問的(de)某個(gè)網段IP給什麼應用(yòng)使用(yòng)脫口而出,而有的(de)人卻對詢問的(de)服(fú)務(wù)器(qì)放在(zài)哪個(gè)機架上都一無所知,當遇到問題或者進行(xíng)數(shù)據中心變更時,後者的(de)表現是顯而易見會(huì)出問題的(de)。最後是要至少精通一門(mén)技術,數(shù)據中心需要運維人員是通材,就是方方面面都要懂一些,但(dàn)是都懂一些相當于都不(bù)懂,這(zhè)樣在(zài)數(shù)據中心裡(lǐ)是無法立足的(de)。還需要有自己精通的(de)領域,至少有一門(mén)是自己精通,而别人無法替代的(de)。比如精通Linux操作系統、精通網絡技術、精通安全技術等等,這(zhè)樣才能在(zài)數(shù)據中心裡(lǐ)立足,然後再向其它領域拓展,最終成為(wèi)一個(gè)技術較為(wèi)全面的(de)運維人才。

      數(shù)據中心的(de)運維工作不(bù)像其它工作,比如測試工程師(shī)、研發工程師(shī)等,有非常明确的(de)職責定位及職業規劃,有職業認同感與成就感。運維工作可能給人的(de)感覺就是哪個(gè)方面都知道(dào)一些,但(dàn)又(yòu)哪個(gè)方面都比不(bù)上專業工程師(shī)更精通,慢慢工作起來就會(huì)迷失方向。其實運維工作也有自身(shēn)的(de)特點,就是什麼領域的(de)技術都有機會(huì)學(xué)習與接觸,掌握的(de)深淺程度主要取決于運維人員的(de)自身(shēn)努力,可以在(zài)多個(gè)技術領域做(zuò)到精通。新(xīn)一代數(shù)據中心給運維工作帶來了更多挑戰,也使得運維成為(wèi)一個(gè)融合多學(xué)科(kē)的(de)綜合性技術,提供了很好(hǎo)(hǎo)的(de)個(gè)人能力與技術廣度的(de)發展空間,運維工作的(de)相關經驗變得越來越重要。正因為(wèi)運維的(de)工作面廣,運維人員轉到其它崗位也很容易,沒有太大的(de)局限性,而且隻有運維工程師(shī)才有機會(huì)成為(wèi)數(shù)據中心的(de)系統架構師(shī)或者運維主管,這(zhè)樣的(de)職業發展前景也比較好(hǎo)(hǎo)。如今的(de)數(shù)據中心已經開始重視(shì)運維技能的(de)提升,大批量引起了不(bù)少高(gāo)精尖的(de)技術人才,從事數(shù)據中心運維人員的(de)技能水(shuǐ)平在(zài)不(bù)斷提高(gāo),将有越來越多的(de)高(gāo)技術人才加入到數(shù)據中心運維隊伍中來。


掃描二維碼

關注昊雲訂閱号


服(fú)務(wù)項目

維保運維服(fú)務(wù)

信息系統集成服(fú)務(wù)

機房(fáng)搬遷服(fú)務(wù)

 
 
 
QQ 在(zài)線客服(fú)
QQ 在(zài)線客服(fú)
 
電話:
0531-88818533
客服(fú)QQ
2061058957
1905215487