本文的一个思路:
一、网络排错的必备条件
二、网络排错的基本思路
三、网络排错详细步骤
四、最后重要说明
一、网络排错的必备条件
为什么还要必备条件?因为这里所讲的网络排错并不仅仅是停留在某一个小小命令的使用上,而是一套系统的方法,如果没有这些条件,我真的不能保证下面讲的这些你可以听得懂,并且能运用到实际当中,所以还是先看看这些基础的条件吧。
1.熟悉OSI七层模型与TCP/IP协议栈
这应该是网络排错要知道的最基本的知识了。
无论是OSI七层模型还是DoD模型,都是用来描述网络通信的一个过程,以让我们对网络数据的发送和接收有一个大致的过程。OSI七层模型对应OSI七层模型的协议,DoD模型对应DoD模型的协议,也就是TCP/IP协议栈。
TCP/IP协议栈里面的协议就显得十分重要了,比如DNS、TCP、UDP、IP、ICMP、ARP,这些最基本的应该得知道吧,我们不需要有像《TCP/IP协议栈》中说得的那么细,但至少,对于这些协议的基本功能我们是必须得要知道的,我想这些就不是我一两名可以说清楚的了,还是那句话,自己百度一下吧。
2.了解网络通信的基础设备和其对应的OSI层次
像交换机、三层交换机、路由器、防火墙这些最基本的网络设备应该要有些了解,尤其是它们对应的OSI层次以及作用,比如普通的二层交换机对应OSI七层模型中的数据链路层,它可以隔绝冲突域,同时可能通过虚拟局域网技术(VLAN)来隔绝广播域,二层交换机通过二层地址即MAC地址来实现数据帧的转发;再比如路由器,它对应网络层,可以提供路由寻址的功能等等。
也许并不需要了解得那么细,但大概的一个过程我想还是应该要知道的。
3.了解中小型企业网络的基本架构
其实就是要知道上面所说的那些网络设备一般是怎么连接起来的,如果在实际环境中排错,应该就要知道当前网络的一个基本架构情况。
这里简单提一下,一般中小型企业网络的基本架构都是这样的:接入层--汇聚层--核心层--网络出口。
网络排错小思路
如果网络环境比较庞大,汇聚层和核心层都会有,像这里的话,就直接没有汇聚层,不过思想是一样的。下面讲的排错其实都是针对用户PC来说明的,事实上,数据中心中的网络排错也是类似的。不管网络环境多么复杂,其实简化下来跟这个都是差不多的。
4.知道常用的网络排错命令
如果用户使用的是Windows操作系统,那么下面的这些命令就很重要了:
ipconfig 查看计算机的IP 地址、子网掩码和网关
ipconfig/all 查看计算机的IP 地址、子网掩码、网关和DNS 地址
ping 测试主机之间的网络连通性
nslookup 请求域名对应的IP 地址,并以此测试DNS 地址是否可用
tracert -d 路由追踪,并且不做反向解析
arp -a 查看计算机是否已获取到网关的MAC地址
如果使用的是Linux操作系统,那么也有对应的相关命令。其实说到底就是要熟悉你所使用的设备,当然,在实际网络排错的过程中,如果只是为了测试网络通信是否正常,你可以把你自己熟悉的设备换上操作。
5.清楚知道网络排错的一个重要原则
网络排错,不就是要判断网络哪里出了问题,因此,你就必须要知道数据的走向。
所以这个重要的原则是:关注数据的走向。
下面讲的网络排错思路其实就是通过追踪数据的走向来一步步缩小网络故障点的,因此,时刻记住这一点非常非常重要!这也是为什么上面需要让你了解中小型企业网络的基本架构了。
二、网络排错的基本思路
基本思路如下,这跟网上的大多数人写的应该是差不多的。
(1)检查物理链路是否有问题
(2)查看本机IP地址、路由、DNS的设置是否有问题
(3)测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试
(4)测试ping公网ip的通畅情况(平时要记几个外部IP)
(5)测试DNS的通畅情况,可以直接ping网站地址
下面的第三部分,就针对上面的基本思路来进行详细的说明。
三、网络排错详细步骤
(1)检查物理链路是否有问题
这一步是我个人认为在做网络排错时必须要做的第一步!经常会听朋友说,领导的×××上不了网,需要过去排错,搞了老半天,还发现不了问题,最后在几经绝望之时,竟然发现网线都没接上×××。这就真的是悲剧了,浪费了很多时间不说,这样的网络排错思路本来就是有错误的。
因为也许不是每个人都可以去机房查看交换机的接线情况,所以这一步,我们排查的重点范围就应该放在×××与交换机连接的哪段线路上。
在这一步,下面几点是需要注意排查的:
1.确认×××本身的网卡有没有问题
2.确认接的网线有没有问题
3.本机所连接的交换机(如果可以去机房查看的话)
如果上面这几点排查都没有问题了,那么就是该网络环境中的其他设备问题了。这一范围的排查相对比较简单,因为只涉及到物理链路的连接问题。
对于这种测试,可以考虑使用测线器,但个人的建议是,拿一台配置正确的笔记本来做测试也未尝不可。**
(2)查看本机IP地址、路由、DNS的设置是否有问题
上面第一步,物理链路的排查没有问题了,也就是说,×××接上网线之后,×××有有反应了,可以识别,但是网络还是不通,来到这一步,就应该先把注意的范围放在×××的设置上面了。
这上步,我们关注的重点是:**
1.IP地址设置
如果采用的是DHCP自动获取的方法,那么这时候只需要看自己本机的设置上有没有开启自动获取IP的设置以及有没有开启相关的服务;
如果用的是静态IP,那么就必须要注意IP地址的填写有没有错(一般网络管理人员给的)、IP地址的子网掩码有没有问题(这很重要,对于静态IP,很多人在这里设置错误,建议是,最好把IP地址、VLSM这方面的知识学一下)。
一般可以用下面的命令查看:
C:\Users\XpLeaf>ipconfig
Windows IP 配置
以太网适配器 本地连接:
连接特定的 DNS 后缀 . . . . . . . :
本地链接 IPv6 地址. . . . . . . . : fe80::4cf8:896f
IPv4 地址 . . . . . . . . . . . . : 192.168.2.1
子网掩码 . . . . . . . . . . . . : 255.255.255.0
默认网关. . . . . . . . . . . . . : 192.168.2.254
相关的设置可以在自己的计算机环境上面查看了。
2.路由设置
对于服务器、PC,一般是指默认网关的设置了;对于路由器本身或三层交换机,那就是静态路由或动态路由的设置问题了。
3.DNS设置
主要是要确保所设置的DNS服务器地址到底有没有提供域名解析服务或者是否出现了故障,至于如何判断,后面会给出方法,这里关注的是,你得设置一个正确的DNS服务器地址或可以自动获取。在windows上面你可以通过下面的命令查看:
C:\Users\XpLeaf>ipconfig/all
Windows IP 配置
以太网适配器 本地连接:
物理地址. . . . . . . . . . . . . : 00-00-29-5E-22-F7
DHCP 已启用 . . . . . . . . . . . : 否
自动配置已启用. . . . . . . . . . : 是
本地链接 IPv6 地址. . . . . . . . : fd60::4ed8:896f:7d55:1432%11(首选)
IPv4 地址 . . . . . . . . . . . . : 192.168.2.1(首选)
子网掩码 . . . . . . . . . . . . : 255.255.255.0
默认网关. . . . . . . . . . . . . : 192.168.2.254
DNS 服务器 . . . . . . . . . . . : 202.116.145.145
202.96.128.86
(3)测试网关或路由器的通畅情况。先测网关然后再测路由器,一级一级地测试
(4)测试ping公网ip的通畅情况(平时要记几个外部IP)
来到这一步的时候,就说明前面三步是没有问题的,也就是说,本地局域网络的通信是正常的,这时要做的就是判断本地局域网络与外网(公网)之间的通信有没有问题了:
这里采取的是直接ping公网地址的方法,是为了排除DNS的影响(万一你的DNS设置又有问题),至于要ping什么样的公网地址,个人建议是,可以ping一些没有禁止ping的公共DNS服务器地址,比如114.114.114.114和8.8.8.8的:
C:\Users\XpLeaf>ping 114.114.114.114
正在 Ping 114.114.114.114 具有 32 字节的数据:
来自 114.114.114.114 的回复: 字节=32 时间=52ms TTL=61
来自 114.114.114.114 的回复: 字节=32 时间=127ms TTL=87
来自 114.114.114.114 的回复: 字节=32 时间=96ms TTL=82
来自 114.114.114.114 的回复: 字节=32 时间=100ms TTL=74
114.114.114.114 的 Ping 统计信息:
数据包: 已发送 = 4,已接收 = 4,丢失 = 0 (0% 丢失),
往返行程的估计时间(以毫秒为单位):
最短 = 52ms,最长 = 127ms,平均 = 93ms
这样之后,基本上就可以确定网络是没有问题的了。当然,这里并没有提到出口放置防火墙的情况,实际上,思路是一致的,但是,你需要考虑的是,你的访问数据有没有被防火墙给过滤掉,是数据出去的时候过滤了,还是数据回来的时候过滤了?由于还要涉及到防火墙的设置,这里就不再提及了,只是仍要注意这一点就是了。
当然,也不排除是ISP那边的问题了,打电话去问问吧。
(5)测试DNS的通畅情况,可以直接ping网站地址
如题,可以直接ping网站地址,看有没有回显IP地址,至于通不通是另外一回事,只要可以回显IP地址,那么DNS就没有问题了,不过这里仍然要说一下nslookup这个命令,这是一个非常好用的命令,我平常自己在网络排错时,基本上都会用到:
C:\Users\XpLeaf>nslookup
默认服务器: server1.gdut-dns.edu.cn
Address: 202.116.145.145
www.baidu.com
服务器: server1.gdut-dns.edu.cn
Address: 202.116.145.145
非权威应答:
名称: www.a.shifen.com
Addresses: 180.97.33.107
180.97.33.108
Aliases: www.baidu.com
四、最后重要说明
其实基本上,一个相对完整的网络排错过程就应该如上面所说的了,不过,是基本上的,因为上面的讲解,都几乎是假定你是没有权限进入机房查看网络设备的情况的。
事实上,你是根本不需要照搬来进行上面的全部步骤的,在实际排错的过程中,可能你用到的只是其中的一小部分而已,毕竟,如果每次都这样下来,没有谁是不会疯掉的,因为一些很简单的问题也要这样折腾,那就是太浪费时间了!但是,上面的方法,只是提出一种网络排错的思路,希望按照这个思路可以判断出网络的问题出现在哪里,至于如何去解决,这中间真的又涉及到太多太多的经验问题(其实遇到问题可以百度),
其实整个下来,我个人觉得,最重要的仍然不是技术本身,而是在网络排错过程当中的一个思路,思路决定出路,这可以让自己在网络排错的过程中时刻保持清醒的头脑,这一点很重要!
作者:xpleaf 来源:https://blog.51cto.com/xpleaf/1689438
原文地址:https://blog.51cto.com/14436064/2419142