Linux服務(wù)器故障排查實用指南
更新:2013/7/3 點擊數(shù):1993
由于造成網(wǎng)絡(luò)問題的因素多種多樣,因此網(wǎng)絡(luò)故障排查技能就成了每位服務(wù)器或網(wǎng)絡(luò)服務(wù)負責人必不可少的重要素質(zhì)。Linux為我們提供了大量網(wǎng)絡(luò)故障排查工具,在本文中,我們將討論一些常見的網(wǎng)絡(luò)問題,并介紹如何利用某些Linux工具追蹤意外狀況發(fā)生的根本原因。 問題:服務(wù)器A無法與服務(wù)器B通信
可能大家在實際工作中最常見的網(wǎng)絡(luò)故障就是一臺服務(wù)器無法與另一臺網(wǎng)絡(luò)上的服務(wù)器進行通信。本小節(jié)將通過實例講解具體處理辦法。在實例中,一臺名為dev1的服務(wù)器無法訪問另一臺名為web1的服務(wù)器中的網(wǎng)絡(luò)服務(wù)(端口80)。導(dǎo)致這一現(xiàn)象的原因相當繁雜,因此我們需要一步步測試操作活動,進而通過排除法找到故障的根源。
一般說來,在對這樣的問題進行故障排查時,大家可能會跳過某些初始步驟(例如檢查鏈接等),因為接下來的某些測試環(huán)節(jié)能起到同樣的診斷作用。舉例來說,如果我們測試并確認DNS能夠正常工作,那么就證明我們的主機是能夠與本地網(wǎng)絡(luò)進行通信的。但在本次實例解析中,我們將本著謹慎的態(tài)度執(zhí)行每一個步驟,借以理解各個級別的不同測試方式。
問題出在客戶機還是服務(wù)器端?
大家可以利用一項快速測試縮小造成故障的范圍,即通過同一網(wǎng)絡(luò)中的另一臺主機嘗試訪問對應(yīng)服務(wù)器。在本實例中,我們姑且將另一臺與dev1同處一套網(wǎng)絡(luò)環(huán)境下的服務(wù)器命名為dev2,并嘗試通過它訪問web1。如果dev2也不能正常訪問web1,那么顯然問題很可能出在web1或者是dev1、dev2及web1之間的網(wǎng)絡(luò)身上。如果dev2能夠正常訪問web1,那么我們就可以斷定dev1出問題的機率較大。首先,我們假設(shè)dev2能夠訪問web1,因此我們開始將故障排查的重點放在dev1這邊。
線纜插好了嗎?
故障排查的第一步要在客戶機上進行。大家首先要確認自己客戶機的網(wǎng)絡(luò)連接沒有問題。要做到這一點,我們可以使用ethtool程序(通過ethtool工具包安裝)對鏈接(即以太網(wǎng)設(shè)備與網(wǎng)絡(luò)構(gòu)成物理連接)情況加以檢測。如果大家無法確定自己使用的是哪個端口,那么請運行/sbin/ifconfig命令將所有可用的網(wǎng)絡(luò)端口及其設(shè)定列出。