數(shù)據(jù)中心機房是企業(yè)信息數(shù)據(jù)匯集、轉(zhuǎn)發(fā)的重要場所。企業(yè)的協(xié)同辦公系統(tǒng)、財務系統(tǒng)、營銷系統(tǒng)、等重要系統(tǒng)的服務器都集中在機房,所以企業(yè)對計算機機房的穩(wěn)定性、可靠性、安全性要求較高。一但電力系統(tǒng)、網(wǎng)絡系統(tǒng)、服務器等出了故障,造成業(yè)務終端,造成的經(jīng)濟損失是不可估計的。
維護機房的目的是:
保障機房設備正常運行,對機房環(huán)境支撐系統(tǒng)、電力系統(tǒng)、監(jiān)控設備、計算機主機設備定期檢測、維護和保養(yǎng),保障機房設備運行穩(wěn)定,降低故障率。確保機房在突發(fā)事故導致硬件設備故障,影響機房正常運作情況下,可及時得到設備供應商或機房服務維護人員的產(chǎn)品維修和技術(shù)支持,并快速解決故障。保障機房設備穩(wěn)定運行,并通過保養(yǎng)延長設備生命周期,降低故障率,下面將服務器機房的維護方法與大家分享。
維護內(nèi)容
1、機房主機設備維護管理:計算機服務器(包括PC服務器及存儲服務器);網(wǎng)絡設備(交換路由設備等)。
2、機房監(jiān)控設備維護管理:供配電監(jiān)測系統(tǒng)、溫度環(huán)境檢測系統(tǒng)、門禁設備系統(tǒng)、保安監(jiān)控設備。
3、機房空調(diào)與配電設備維護管理:空調(diào)設備、新風設備、UPS電池、主配電箱。
4、機房消防設備維護管理:煙感熱感探測器、手動報警按鈕和報警控制器、滅火器的控制裝置。
5、機房供水水路、電路及照明維護管理:水電路管線及接口的檢查維護。
6、機房基礎維護管理:機柜線路的整理、標簽檢查更換、機房除塵清潔、防火地板、墻面、吊頂、門窗及相關配套的維護管理。
數(shù)據(jù)中心機房的維護方法:
1、機房除塵及環(huán)境要求:定期對設備進行除塵處理,清理,調(diào)整安保攝像頭清晰度,防止由于機器運轉(zhuǎn)、靜電等因素將塵土吸入監(jiān)控設備內(nèi)部。同時檢查機房通風、散熱、凈塵、供電、架空防靜電地板等設施。機房室內(nèi)溫度應控制在 5℃~ 35℃,相對濕度應控制在30%~85%。
2、機房空調(diào)及新風維護:檢查空調(diào)運行是否正常,換風設備運轉(zhuǎn)是否正常。從視鏡觀察制冷劑液面,看是否缺少制冷劑。檢查空調(diào)壓縮機高、低壓保護開關、干燥過濾器及其他附件。
3、UPS及電池維護:根據(jù)實際情況進行電池核對性容量測試;進行電池組充放電維護及調(diào)整充電電流,確保電池組正常工作;檢查記錄輸出波形、諧波含量、零地電壓;查清各參數(shù)是否配置正確;定期進行UPS功能測試,如UPS同市電的切換試驗。
4、消防設備維護:檢查火警探測器、手動報警按鈕、火災警報裝置外觀及試驗報警功能;檢查火災警報控制器的自檢、消音、復位功能及主備用電源切換功能。
5、電路及照明電路維護:鎮(zhèn)流器、燈管及時更換,開關更換;線頭氧化處理,標簽巡查更換;供電線路絕緣檢查,防止意外短路。
6、機房基礎維護:靜電地板清洗清潔,地面除塵;縫隙調(diào)整,損壞更換;接地電阻測試;主接地點除銹、接頭緊固;防雷器檢查;接地線觸點防氧化加固。
7、機房運維管理體系:完善機房運維規(guī)范,優(yōu)化機房運維管理體系。維護人員24小時及時響應。
機房服務器日常維護步驟:
1、開機順序
一般地說,系統(tǒng)開關機應嚴格遵循以下步驟:打開總電源-> 打開計算機機柜電源-> 打開外部設備電源(如磁盤陣列,磁帶庫等)-> 待外部設備自檢完成后,最后打開主機電源.
2、關機順序
進行操作系統(tǒng)的關閉(shutdown -h -y 0)-> 關閉主機電源.-> 關閉外設電源.(如磁盤陣列,磁帶庫等)-> 關閉其他設備電源和機柜電源;-> 最后關閉總電源。
3、電纜連接注意事項
在進行電纜連接(插拔)時,最重要的一點是,通過該電纜連接(或?qū)⒁B接)的設備應當是沒有加電的,即應當先將設備的電源關掉,然后再進行電纜連接(插拔)操作。否則,如果帶電進行電纜連接,會造成對設備無法預料的損壞。
4、硬件故障診斷
(1)電纜連接
注意計算機及各外設之間連線接觸良好,不要無故拔插電纜;如果發(fā)生計算機不能識別某個設備,有可能是電纜的接觸問題。
(2)硬件狀態(tài)指示燈
如果發(fā)現(xiàn)系統(tǒng)工作不正常,可以觀察硬件狀態(tài)指示燈的情況。開機后系統(tǒng)將自動完成自測試,診斷及引導啟動代碼。
檢測順序大致為:高速緩存,中央處理器,總線,內(nèi)存,I/O設備。當檢測到相關的硬件時,對應的顯示燈會亮。
硬盤,軟盤,磁帶機及光盤驅(qū)動器自檢時,能從前面板上看到相應的燈亮一下,表明系統(tǒng)已經(jīng)識別到上述設備。相反,如果某驅(qū)動器的自檢燈沒亮,很可能是該設備有問題。
另外,主機背后的SCSI接口卡及網(wǎng)絡接口卡上的自檢指示燈亮為正常狀態(tài)。否則,可能該接口卡有問題。如果發(fā)現(xiàn)這種問題,請馬上與HP聯(lián)系,考慮更換備件。
(3)錯誤代碼
每次開機后,系統(tǒng)都會進行硬件自檢及初始化,假如系統(tǒng)出現(xiàn)硬件故障,一般都不能正常啟動,并在液晶顯示屏及控制臺上相應的顯示出錯誤代碼及出錯信息。
若屏幕上出現(xiàn)ERROR且液晶顯示上出現(xiàn)FLT,表明有故障發(fā)生,應根據(jù)上述提示確定故障點。
絕大部分硬件錯誤都能在自檢時暴露出來,在液晶顯示及控制臺的左下角都有四位錯誤代碼:FLT xxxx。
分析這四位代碼可以進一步檢測出故障。發(fā)現(xiàn)這種問題,請馬上與HP聯(lián)系,分析相應的故障原因。
數(shù)據(jù)中心的機房維護都需要注意的內(nèi)容
數(shù)據(jù)中心是全球性的特定網(wǎng)絡,主要作用是傳遞、加速、展示、計算和存儲Internet上的數(shù)據(jù)信息的。數(shù)據(jù)中心的服務器數(shù)量可以有很多,但是它又不僅僅只是包含了很多的服務器,它還包含了各種各樣的數(shù)據(jù)通信存儲、各種監(jiān)控和安全設備等,內(nèi)部是比較復雜的。
數(shù)據(jù)中心后期的維護是很重要的,對環(huán)境的要求也是很嚴格的,當然這些設備需要適應相同的環(huán)境,這樣維護起來會更方便。
(1)首先是一定要遠離腐蝕性氣體和易燃易爆物體,因為這些氣體會隨著機房的通風口進入,不管是對工作人員還是對機器設備都很不利,還會造成一些濾網(wǎng)的污染。
(2)其次就是溫度和濕度一定要控制好,嚴格控制在規(guī)定的標準范圍內(nèi)。干球溫度計要在20℃到25℃(68F~77F)之間,相對濕度要在40%到50%之間。
(3)另外一個因素是噪聲和照度。主機房中心的噪聲保持在65dB(A)以下是正常的一個范圍,照度是距地0.8米處應該高于300lx,輔助房間的要大于200lx。
(4)還有一個因素是需要我們注意的,那就是無線電和磁場的干擾場強,這個在設置的時候要根據(jù)規(guī)定的大小。
數(shù)據(jù)中心的機器比較多,散熱問題需要注意,要有制冷系統(tǒng)來穩(wěn)定機房內(nèi)的溫度。當然,要想維護好數(shù)據(jù)中心,還有很多的小細節(jié)需要我們注意,以上幾點是我們比較常見的,我們在工作過程中可以根據(jù)自己的情況,做好其他的小細節(jié)。
數(shù)據(jù)中心機房維護計劃
1、周維護主要內(nèi)容:
(1)清潔機架內(nèi)外、設備面板和監(jiān)視器、顯示器屏幕;
(2)檢查個切換開關功能鍵、監(jiān)測報警系統(tǒng)的功能及各設備指示狀態(tài);
(3)檢查機房供配電系統(tǒng);
(4)檢查機房空調(diào)和照明設備。
2、月維護主要內(nèi)容:
(1)周維護所有內(nèi)容;
(2)整理各機架設備連接線;
(3)檢查服務器配置情況;
(4)檢查交換機各個端口工作狀態(tài);
(5)檢查服務器運行狀態(tài)并記錄;
(6)檢查各光發(fā)射、接收設備的工作狀態(tài)。
3、季維護主要內(nèi)容:
(1)周、月維護所有內(nèi)容;
(2)清潔機房空調(diào)的過濾網(wǎng),檢查空調(diào)運行情況,必要時補充制冷劑;
(3)按操作規(guī)程對蓄電池進行完全的充放電維護;
(4)對接收天線進行全面性能檢查和維護。
4、年維護主要內(nèi)容:
(1)周、月、季維護所有內(nèi)容;
(2)清潔各設備的電路板和接插件;
(3)清潔各監(jiān)視器和計算機內(nèi)部;
(4)檢查調(diào)整信號源和設備測試口的電平及性能指標;
(5)檢查調(diào)整各監(jiān)測、報警系統(tǒng)的門限閥值。
來源:機房百科