SR66系列路由器故障发生时“搜魂大法”
--张玺
一、为快速准确定位故障原因,需要收集以下信息:
1、设备诊断信息(diagnostic-information)。
在任意视图下使用命令display diagnostic-information,显示如下:
<SR66>display diagnostic-information
Save or display diagnostic information (Y=save, N=display)? [Y/N]:
(1)选择Y,将诊断信息保存在设备CF卡中。以下示例将诊断信息文件命名为SR66info.diag,保存成功后,在设备CF卡中可以看到诊断信息文件。
Please input the file name(*.diag)[cfa0:/default.diag]:SR66info.diag
Diagnostic information is outputting to cfa0:/SR66info.diag.
Please wait...
Save successfully.
<SR66>dir
Directory of cfa0:/
2 -rw- 1055636 Oct 08 2013 15:08:50 SR66info.diag
随后,通过FTP等方式将诊断信息文件导出即可。
(2)选择N,则在终端上直接输出诊断信息内容(可通过Secure CRT软件的Log Session功能记录并保存输出的诊断信息内容)。
注:以上两种收集方法,优选方法(1),以避免其它因素导致收集的信息内容不完整。
2、设备日志文件(logfile)。
SR6600/SR6600-X系列路由器 logfile文件保存在设备CF卡的logfile文件夹中,默认情况下,每个logfile文件最大能占用的存储空间为2M。
收集设备日志文件时,首先在任意视图下使用命令logfile save,将日志文件缓冲区中的内容全部保存到日志文件中。
<SR66>logfile save
Saved the log file buffer to file cfa0:/logfile/logfile1.log successfully.
随后进入CF卡的logfile文件夹:
<SR66>cd logfile/
<SR66>dir
Directory of cfa0:/logfile/
0 -rw- 1190710 Oct 08 2013 16:51:30 logfile1.log
(1)可以通过FTP等方式将日志文件导出。
(2)可以使用以下命令将日志文件中的内容直接在终端输出(可通过Secure CRT软件的Log Session功能记录并保存输出的日志文件内容)。
<SR66>more logfile1.log
注:以上两种收集方法,优选方法(1),以避免其它因素导致收集的信息内容不完整。
如果设备中存在多个logfile文件,只需收集故障发生期间对应的logfile文件。
如果设备配有双主控板,并且在故障发生期间发生过主备倒换,则需将两块主控板的logfile信息全部取出。
3、设备coredump信息。
SR6600/SR6600-X系列路由器coredump信息保存在设备CF卡的coredump文件夹中。
<SR66>cd coredump/
<SR66>dir
Directory of cfa0:/coredump/
0 -rw- 127120 Oct 08 2013 15:08:44 mon_dump_0
1 -rw- 133504 Jan 23 2013 09:11:52 core_dump_slot0_0
将此文件夹的全部文件通过FTP等方式导出即可。
注:如果设备配有双主控板,并且在故障发生期间发生过主备倒换,则需将两块主控板的coredump信息全部取出。
4、其它信息。
(1)客户局点信息。
(2)如果客户局点组网比较复杂,需反馈详细网络拓扑。也可根据问题具体情况,收集网络中其它设备的配置等信息。
(3)问题详细描述。包括故障发生时间、故障是否首次出现、故障影响范围、故障具体现象、故障发生后做过的相关操作(最好有操作记录),等等。
(4)如果故障现象需要以图片或者视频的方式反馈信息(比如设备指示灯状态、光模块信息、板卡物理变形信息等等),则反馈图片或者视频。
二、故障发生后,如果客户要求尽快恢复业务,则处理方法如下:
1、使用display diagnostic-information 命令,并选择Y,将诊断信息保存在设备CF卡中。
2、使用使用命令logfile save,将日志文件缓冲区中的内容全部保存到日志文件中。
3、做恢复业务操作,如重启设备,等等。
4、业务恢复后,按前文所述收集信息,并反馈给相关人员处理。