服務器硬盤壞了怎么處理?
大數據時代,如何保證數據安全性,顯得更加重要。從簡單的定期備份,到備份系統、到災備解決方案等等,那么如果服務器硬盤壞了怎么處理呢?當然為了確保數據安全。而不論何種方案,都必須將數據存放在底層的物理設備(硬盤、磁帶等)。
服務器硬盤壞了會有一系列的表現:
1、故障提示。也就是我們常說的,硬盤自我監測、分析錯誤報告。在其控制的磁頭、磁盤、電路等部件發生與預存的安全值發生沖突的時候,就會自動發生警告信息。而當出現這個故障提示的時候,我們就改引以為戒,盡快分析和處理。
2、硬盤無法識別。啟動時,時不時的顯示硬盤無法識別,或者即便能識別,但是系統顯示無法顯示硬盤,這就是物理故障的前兆。這個時候,我們就需要對重要數據進行轉移,而后進行檢測維修。
3、系統運行出錯。服務器運行過程中,不斷出現程序錯誤的狀況,而且磁盤掃描問題,停滯、甚至死機。這個時候,就代表硬盤發生故障了,當然了,也可能是因為安裝系統故障的原因,在我們排除軟件問題后,就能確定是硬盤故障,需要進行檢修。
4、運行報錯。掃描磁盤,發現錯誤,甚至顯示出現壞道。這個時候則表示硬盤部件問題,出現了壞道,我們需要將其進行隔離,保證正常使用。
5、初始化死機。初始化即死機,雖然不排除其他部件發生問題的可能性,比如內存問題、風扇問題、系統中毒等等,但是,最可能還是因為硬盤故障的問題,需要進行相關分析。
服務器硬盤壞了的故障定位和分析
1、名詞解釋
- DSA : IBM 日志收集工具
- DSET :DELL日志收集工具
- TTY :硬盤日志收集工具
- Slot Number :服務器硬盤槽位號,dell/IBM服務器槽位號從O開始
- Media Error Count:硬盤物理錯誤數
- Other Error Count:硬盤邏輯錯誤數
- Predictive Failure Count:預告警數
- Raw Size:磁盤容量
- PD Type: 磁盤類型(SAS,STAT)
- Firmware state:硬盤狀態
- RAID Level :陣列等級
- State :陣列狀態
2、收集日志及陣列穿孔
不僅僅是硬盤故障的時候需要收集日志,在服務器診斷中,線索往往是撲所迷離的,憑借經驗或者猜測,無法正確地判斷設備故障原因,排除故障,收集日志提交給售后工程師,可以快速和有效的縮小問題范圍,精準定位故障點。
服務器出現故障后,必須一步步檢測解決,走捷徑可能會付出巨大的代價!收集日志可以大大減少數據丟失風險,避免多次上門維修,反復溝通造成的時間和精力浪費。當然過保的機器,就需要我們自己學會查看日志文件了。
DSA日志
DSA日志是IBM機器保修時候,必要的日志,他可以收集所有的硬件健康狀態日志,這里不多做介紹,只要一個文件在系統里執行完成后可以順利收到日志
DSET日志
DSET日志是DELL機器保修時候,必要的日志,功能如同DSA日志,DSET日志可以收集所有硬件健康狀態日志,還可以收集到硬件的部件號,售后可以根據部件號來確認故障配件是否屬于本機原配,若不是原配配件,則需要另外提供采購的配件訂單號。
TTY日志
TTY日志是硬盤故障時,硬盤故障最怕的就是出現陣列穿孔,收集TTY日志,可以直觀的看出陣列是否出現了穿孔(關鍵字:Puncturing bad block),自己可以收集TTY日志并查看。
#unzip MegaCli8.02.21forLinux.zip
#ll
-rw-r--r-- 1 root root 1588725 May 17 2011 Lib_Utils-1.00-09.noarch.rpm
-rw-r--r-- 1 root root 1272097 Oct 24 2011 MegaCli-8.02.21-1.noarch.rpm
-rw-r--r-- 1 root root 2848229 Sep 8 17:12 MegaCli8.02.21forLinux.zip
-r--r--r-- 1 root root 2683 Oct 24 2011 readme.txt
-rw-r--r-- 1 root root 7404 Apr 13 2012 Run-Linux-PERC6-v1.0.sh
#chmod +x Run-Linux-PERC6-v1.0.sh
#./Run-Linux-PERC6-v1.0.sh
日志存放在當前目錄下,名稱為PERCLINUX.tgz
3、業務定位
根據故障定位分析,你還是不能直接更換故障硬盤,因為換硬盤都會存在風險的,所以,在做所有的故障硬盤更換之前,都必須確認好業務,特別是在RAID0的時候!RAID0的硬盤出現故障,只要數據有備份,業務確認可以更換,那就可以直接處理
常見的服務器硬盤壞了的原因和處理方式
1.硬盤系統故障
服務器硬盤發生系統故障主要表現的方式為中斷,跳出,停滯等現象。這些的故障發生也不全部都是因為硬盤的問題,也有可能是系統的故障。我們在排除系統故障以后,就需要對硬盤進行檢修了。
2.硬盤物理故障
我們在服務器托管使用過程中,硬盤故障一般表現為無法識別硬盤里面的存儲數據,或者是無法讀取數據,這就導致用戶無法使用硬盤。我們在遇到這種問題的時候,處理辦法就是先對數據進行轉移,之后對硬盤進行檢查維修。
3.硬盤運行故障
硬盤的運行故障一般都是很容易發現的,主要表現在掃描磁盤的時候發現錯誤。這種情況一般表現為壞道發生情況,我們就需要對硬盤進行隔離,保障硬盤的正常使用。
壞道分布情況
1、少量壞道,可以嘗試有軟件修復
2、大量壞道,且集中,那可以專門分個區,然后把分區隱藏,避免壞道擴散。
3、壞道多,分布均勻,直接換硬盤。
好了,以上就是關于“服務器硬盤壞了怎么處理”的相關內容,你可以通過以上方式排查,也可以使用TestDisk、EaseUS Partition Master Free、WinDirStat等常用的磁盤轉換和數據修復工具來解決。