故障排除比科学还重要。诊断问题时,最重要的工具是对网络的深入了解:什么连接到什么,以及什么在逻辑上和物理上都在哪里。您几乎需要可视化从一台设备发送到另一台设备的数据包。

那’s where 网络图, 拓扑映射布线电子表格 变得非常重要。如果你不这样做’由于不知道该错误但关键的设备连接在哪里,因此通过追踪电缆找到正确的连接是一种沮丧的尝试,也许是徒劳的。

除了保持物理和逻辑网络拓扑的最新状态外,我还希望通过使交换机和路由器接口上的描述字段保持最新状态来为故障排除会话做准备,从而使我能够快速找到问题。做一个“show interface brief”在您的交换机上。每个活动端口都应该有一个描述,并且最有用和最重要的信息应该放在首位,以便它’t get cut off.

从ping开始

让’假设您的设备’回应。首先要验证的是’甚至在网络上。 ping它。这等效于网络,是否已插入?打开了吗?如果通过主机名知道目标设备,并且DNS正在运行,则ping还会告诉您IP地址。

C:\Users\Kevin>ping www.auvik.com

Pinging www.auvik.com [162.159.251.58] with 32 通过 tes of data:
Reply from 162.159.251.58: 通过 tes=32 time=36ms TTL=55
Reply from 162.159.251.58: 通过 tes=32 time=30ms TTL=55
Reply from 162.159.251.58: 通过 tes=32 time=29ms TTL=55

Ping statistics for 162.159.251.58:
    Packets: Sent = 3, Received = 3, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
    Minimum = 29ms, Maximum = 36ms, Average = 31ms

您与目标设备位于同一子网中吗?如果是这样,则可以从地址解析协议(ARP)表中获取其MAC地址。在Windows上看起来像这样:

C:\Users\Kevin>arp -a

Interface: 10.10.80.2 --- 0xd
  Internet Address      Physical Address      Type
  10.10.80.1            00-ff-3d-be-ac-6b     dynamic
  10.10.80.6            20-c9-d0-ac-22-a1     dynamic
  10.10.80.255          ff-ff-ff-ff-ff-ff     static
  224.0.0.22            01-00-5e-00-00-16     static
  224.0.0.252           01-00-5e-00-00-fc     static
  239.255.255.250       01-00-5e-7f-ff-fa     static
  255.255.255.255       ff-ff-ff-ff-ff-ff     static

C:\Users\Kevin>

在这里你可以看到我’m 10.10.80.2,我知道网段上另外两个设备,即10.10.80.1(路由器)和10.10.80.6(另一台计算机)。

在Cisco设备上,使用以下命令获取ARP条目:“show ip arp”命令。其实我’d generally use “显示ip arp |包括 ”避免不得不从可能的条目页面直观地搜索正确的地址。我使用以下命令获取MAC地址:

Router1#显示ip arp |包括 10.10.80.6
Internet 10.10.80.6 8 20c9.d0ac.22a1 ARPA Ethernet0
Router1#

大多数ARP地址是动态学习的。如果该设备从未运行过,则Cisco设备会显示一个“incomplete”条目。在Windows上,它通常不会出现在列表中。如果根本不存在,请先ping它。这将迫使ARP协议尝试发现它。

Router1#显示ip arp | i 10.10.80.65
Internet 10.10.80.65 0 Incomplete ARPA Ethernet0
Router1#

追踪MAC

一旦有了MAC地址,下一步就是找到它的交换机端口’连接到。在交换机上,命令是“ show mac address-table address <-address->.”请注意,思科已更改此命令的语法。在某些交换机上,它“显示mac-address-table地址。”

Switch1#show mac address-table address 20c9.d0ac.22a1
          Mac Address Table
-------------------------------------------

Vlan    Mac Address       Type        Ports
----    -----------       --------    -----
 100    20c9.d0ac.22a1    DYNAMIC     Fa0/19
Total Mac Addresses for this criterion: 1
Switch#

这将告诉您交换机最后一次使用该MAC地址看到的端口。使用“ show interface”命令查看该端口的状态。起来了吗它是到另一台交换机的中继链路吗?

如果是到另一台交换机的中继链路,则需要找到另一台交换机并重复此过程,直到找到目标设备。再一次,对界面进行详细说明非常有帮助。这是该设备的正确接口吗?

CDP

我对思科发现协议(CDP)感到百感交集。这对于弄清事物之间的连接非常有用。

Router1#show cdp neighbors
Capability Codes: R - Router, T - Trans Bridge, B - Source Route Bridge
S - Switch, H - Host, I - IGMP, r - Repeater
Device ID Local Intrfce Holdtme Capability Platform Port ID
Router2 Ser 0/0 179 R 2621 Ser 0/1
Switch1 Fas 1/0 152 T S WS-C2924 2/2
Router1#

上面的输出显示了该网络上的其他两个Cisco设备,使您可以轻松地映射中继链路和Cisco设备之间的其他链路。

CDP的问题在于它几乎太有用了。所有这些信息遍布整个网络。如果我已连接到该网络,则可以快速了解交换机的名称和管理IP地址。即使我没有连接到网络,但如果您的PC上正在运行恶意软件,我也会获得相同的信息。对于有恶意的人,这是很多信息。

因此,我经常禁用CDP。然后我想念它。

某些物理连接导致间歇性故障

最难解决的问题是,当您寻找时一切似乎都还可以的问题,但后来又回来了。间歇性问题的原因很多,但由于本文主要涉及物理连接,因此让我们看一下与物理问题有关的原因。

单向链接

有时,物理电缆或接口将停止发送或接收数据。这在光纤链路中经常会发生,其中一根物理光纤发送而另一根接收信号。其中一台设备认为链接正常,但丢失了一半数据。

这在切换到切换链接时特别糟糕。开关使用 一种称为生成树的协议 消除循环。如果您在两台交换机之间建立单向链路,则交换机A会认为链路已建立,而交换机B会认为链路已断开。交换机A将看不到来自交换机B的任何生成树数据包,因此生成树将保持链路畅通。但是如果有’从开关B到开关A的另一条链接,我们形成了一个循环。

思科具有称为单向链路检测(UDLD)的功能。在光纤接口上启用此命令。

循环通常会导致交换机上的CPU利用率很高(“ show process cpu”)。另外,由于循环中涉及的大多数数据包都将被广播,并且由于广播被发送到公共VLAN上的所有接口,因此“ show interface”命令将显示5分钟的输入和输出速率非常高的值。许多接口。请特别注意“显示界面”输出中的“广播”计数器。

实际环路的最大问题是整个网络可能无法使用,其结果是您无法登录交换机来找出问题所在。

电缆或端口故障

交换式以太网网络上间歇性物理故障的最常见原因是Flakey连接。有时交换机上的端口损坏。有时跳线不好。有时,连接到目标设备的电缆损坏。对这些问题进行故障排除始于将问题隔离到单个设备。

如果您的单个设备似乎一直出现异常,则要查找的问题之一是接口状态是否已更改。

Switch# show interfaces gigabitethernet1/0/2
GigabitEthernet1/0/2 is down, line protocol is down (notconnect)
 Hardware is Gigabit Ethernet, address is 2037.064a.0b02 (bia 2037.064a.0b02)
 MTU 1500 通过 tes, BW 1000000 Kbit/sec, DLY 10 usec,
    reliability 255/255, txload 1/255, rxload 1/255
 Encapsulation ARPA, loopback not set
 Keepalive set (10 sec)
 Auto-duplex, Auto-speed, media type is 10/100/1000BaseTX
 input flow-control is off, output flow-control is unsupported
 ARP type: ARPA, ARP Timeout 04:00:00
 Last input never, output never, output hang never
 Last clearing of "show interface" counters never
 Input queue: 0/2000/0/0 (size/max/drops/flushes); Total output drops: 0
 Queueing strategy: fifo
 Output queue: 0/40 (size/max)
 5 minute input rate 0 bits/sec, 0 packets/sec
 5 minute output rate 0 bits/sec, 0 packets/sec
    0 packets input, 0 通过 tes, 0 no buffer
    Received 0 broadcasts (0 multicasts)
    0 runts, 0 giants, 0 throttles
    0 input errors, 0 CRC, 0 frame, 0 overrun, 0 ignored
    0 watchdog, 0 multicast, 0 pause input
    0 input packets with dribble condition detected
    0 packets output, 0 通过 tes, 0 underruns
    0 output errors, 0 collisions, 1 interface resets
    0 unknown protocol drops
    0 babbles, 0 late collision, 0 deferred
    0 lost carrier, 0 no carrier, 0 pause output
    0 output buffer failures, 0 output buffers swapped out

在此输出的底部附近,您可以找到一个标记为“接口重置”的计数器。”通常,这将是一个很小的数字,如本例所示。如果数量很大,请等待几秒钟,然后再次运行该命令。它增加了吗?这是一个脆弱的物理连接的结果。

尝试更改交换机端口。问题会消失还是随电缆一起移动?如果问题仍然存在,则可能是交换机端口连接良好且电缆连接不良。尝试更换跳线。逐一交换元素,直到问题解决。

最终,许多物理故障排除练习都归结为交换元素直到问题消失的过程。关键是缩小问题范围,以便您’重新交换尽可能少的元素。否则可能需要一段时间。