服務器維修基本技術手冊
第一章服務器維修的基本原則和注意事項
§1.1基本原則:
1、 先想後做。
先想好怎麼做,再實際動手。先分析判斷,再進行維修。
2、 不懂要問。
不确定的情況,要查資料,咨詢同事,TS L2,TAM 後,才動手。
3、 先外後内。
先觀察使用周圍環境。設備位置、電源、連接、其它設備、溫度與濕度是否正常。 之後看設備故障的現象。顯示的内容,及它們與正常情況下的異同。
再看設備内部情況。灰塵、是否腐蝕、連接、器件的顔色、部件的形狀、指示燈的狀态等。 最後看設備的軟硬件配置安裝了何種硬件,資源的使用情況;使用的是使種操作系統,其上又安裝了何種應用軟件;硬件的設置驅動程序版本等。
4、 先軟後硬。
先檢查軟件問題,當可判軟件環境是正常時,如果故障不能消失,再從硬件方面着手檢查。
5、 分清主次。
在複現故障現象時,有時可能會看到一台故障機不止有一個故障現象,而是有兩個或兩個以上的故障現象(如:啟動過程中無顯,但機器也在啟動,同時啟動完後,有死機的現象等),為時,應該先判斷、維修主要的故障現象,當修複後,再維修次要故障現象,有時可能次要故障現象已不需要維修了。
§1.2 注意事項
一、需要提醒客戶備份數據
二、 準備充足的服務器拆裝工具和防止靜電設備.
三、 維修前充分觀察客戶使用環境和相關的軟件狀況
四、 對于複雜的客戶應用環境, 需要客戶配合做相關操作, 例如服務器的開關操作及應用關閉
五、 拆裝部件時的觀察:要有記錄部件原始安裝狀态的好習慣
六、 加電過程中的觀察:元器件的溫度、異味、是否冒煙等;
六、 請求技術支持之前需要提供詳細的硬件軟件狀态及已經完成詳細操作過程和相關日志
第二章常見故障判斷和維護方法
一、服務器加電類故障 No Power
1、檢測服務器面闆指示燈和電源指示燈, 及服務器開關指示燈;
2、查看電源所連接的電源線;
3、 針對服務器電源冗餘配置, 嘗試做交換檢測
4、服務器最小化操作及服務器Nvram 清除
5、觀察服務器電源及内部備件是否有冒煙等現象發生
6、更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
二、服務器自檢類故障 No Post
1、檢測服務器是否有得到電源供應
2、查看服務器前面闆的具體報錯信息, 并且針對錯誤信息做相關操作
3、 針對服務器外部連接設備做移除操作
4、服務器最小化操作及服務器Nvram 清除
5、針對服務器啟動的主要備件做插拔及最小化操作
6、更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
三、服務器内存故障
1、檢測服務器前面闆是否有内存錯誤, 并且收集DSET 和SA 日志
2、 服務器Nvram 清除
3、 針對服務器故障内存做重新插拔操作
4、更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
四、服務器死機及不穩定故障
1、收集服務器DSET 和SA 及操作系統的日志
2、查看服務器安裝的應用軟件
3、 盡量在客戶同意下升級Bios/BMC FW/Driver到最新
4、移除服務器上第三方硬件并且最小化及服務器Nvram 清除
5、針對服務器啟動的主要備件做插拔及最小化操作
6、更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
五、服務器陣列卡和硬盤故障
1、收集服務器當前的陣列信息和硬盤配置及槽位, 并且收集服務器DSET 和TTY 日志
2、在操作系統能夠正常啟動的時候, 确保服務器的數據備份
3、 盡量在條件允許和客戶的同意下檢測HD 及SCSI/SAS/SATA等數據線和鍊路狀況
4、更換故障備件, 如果更換硬盤要确保有處在重建狀态, 并且要和客戶溝通了解重建結果
5、如果服務單有針對硬盤的FW 操作, 需要做相關操作
6、更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
六、服務器陣網絡故障
1、檢測服務器網卡的安裝情況, 是否有松動及網卡指示燈, 并且做網線的檢測
2、在操作系統下做網絡Ping 操作, 并且檢測IP 配置, 網卡Duplex 和Speed 配置情況
3、 盡量在條件允許下檢測服務器BIOS 裡面的網卡配置, 及網卡診斷
4、更換網卡所連接的外部HUB 和交換機的端口, 網線更換. 直連服務器網卡
5、嘗試直連服務器網卡, 排除網絡設備引起的問題
6、嘗試操作系統下更新網卡驅動和FW
7、更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
七、服務器及磁帶機故障
1、檢測服務器1啟動過程和操作系統下正确識别到磁帶機設備
2、在操作系統下嘗試更新磁帶機的驅動, 有條件可以清潔磁帶機
3、 如果是使用第三備件軟件, 收集備份軟件的日志
4、針對磁帶機經常卡帶, 保證磁帶機的FW 是最新
5、針對帶庫磁帶設備, 收集日志和相關的錯誤信息
6、 更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
八、服務器及磁盤存儲故障
1、針對服務器和所連接的磁盤存儲, 掌握基本的關開系統的操作
2、基本掌握磁盤存儲的管理配置和使用, 及相關日志的收集方法
2、針對磁盤的維護, 參考服務器陣列卡和硬盤故障
3、 對于服務器和磁盤存儲的複雜問題, 及時了解故障情況, 多收集信息
4、強調備份數據的重要性
5、針對複雜問題及不能修複的問題, 及時和技術支持聯系
6、 更換故障備件做檢測, 并且升級Bios/BMC FW/Driver到最新
- 上一篇:雲服務器 CVM 2019/11/30
- 下一篇:H3C UniStor X10000 G3系列分布式融合存儲 2019/11/30