华为AR系列快速维护指南"/>
华为AR系列快速维护指南
快速维护
华为AR系列路由器
文档版本:07(2020-06-02)版权所有 © 华为技术有限公司 2020。 保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分
或全部,并不得以任何形式传播。
商标声明
和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意
您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中
描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。除非
合同另有约定,华为公司对本文档内容不做任何明示或默示的声明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,
本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或
暗示的担保。
华为技术有限公司
地址:
深圳市龙岗区坂田华为总部办公楼 邮编:518129
网址:
更多的参考资料
13
无法登录设备的处理措施
11
故障信息的收集和反馈
9
如何快速维护AR路由器
3
开始之前
2
危险操作警示
1危险操作警示
硬件类危险操作警示
请勿随意拔插机柜内部线缆
请勿在未戴防静电腕带的情况下拔插单板
请勿随意拔出主用主控板
请勿随意按下主控板的RST按钮
软件类危险操作警示
请勿随意使用reboot命令重启设备
请勿随意使用reset slot命令重启单板
请勿随意使用power off slot命令给单板下电
请勿随意使用shutdown命令关闭物理端口
请勿随意使用format命令格式化存储设备
请勿随意使用delete命令删除存储设备中的文件
请勿随意使用reset命令复位各类协议
请勿随意改动Console口和VTY用户界面的验证方式和用户登录密码
AR150&AR160&AR200系列、AR510系列、AR2201-48FE、AR2202-
48FE、 AR150-S&AR160-S&AR200-S系列以及AR2201-48FE-S不支持
reset slot命令和power off slot命令。 另外,AR510系列也不支持format命令。
1开始之前
在您接管本设备的维护工作之前,建议首先完成如下工作:
1 获取整个网络的拓扑结构图和数据规划表(端口、VLAN、IP地址等),打印之后张贴在机房的醒目位
置,便于随时查询和对照。
2 获取以下常用联系方式 信息,并打印和张贴在您的工作台附近。
华为企业业务技术支持热线电话(400-822-9999)。
负责贵单位网络建设和服务的代理商的联系电话。
3 准备好设备维护中可能使用到的工具和线缆,以备随时使用。
4 访问华为企业技术支持网站(/)并注册一个用户账号,以方便
浏览或下载更有价值的产品文档、案例、公告等信息,并可获得订阅和推送方面的支持。
序号
项目
说明
1
线缆
维护终端
辅助仪器、仪表
一根标准RS232串口线:用于通过Console口登录设备。
串口转USB转接头:用于使用维护终端的USB接口连接设备的串口。
两根直连网线:用来调测管理网口或其他业务。
若干条光纤、若干SFP/eSFP/SFP+光模块:用于连接对接设备。
一台维护终端,一般为便携计算机,并安装串口通信软件,用于登录设备。
光功率计:用于光接口测试(光功率、接收灵敏度等)。
2
3
2
4
以下涉及的命令回显以V200R005C20版本为例,如您使用的是路由器其他版本
请以设备显示为准。版本间如有不易于理解的差异,正文中会有相应说明。如何快速维护AR路由器
开始
检查指示灯状态
并处理异常
检查设备告警并
处理异常
检查设备健康状
态并处理异常
检查单板状态并
处理异常
是否能够
处理异常?
记录故障信息并
反馈
结束
否
是
您可以按照下列流程对AR路由器进行维护:
3
检查告警、健康状态、单板状态以及记录故障信息等步骤,均需要通过Console口、
Telnet或STelnet登录到设备来进行操作(登录设备的操作请参考本设备的《配置
指南-基础配置》文档)。如果无法登录到设备,请直接查看“无法登录设备的处
理措施”。检查设备指示灯状态是否正常
通过巡视检查设备的各指示灯状态是否正常,如果发现异常状态,请及时记录故障信息,并参考本设备
《硬件描述》文档中的各指示灯状态含义描述,如果无法解决,请及时联系代理商或华为企业业务技术支
持热线。
下表列出了设备各主要指示灯的正常状态。
4
注:关于各指示灯的名称含义,以及各种状态的详细描述,请参见本设备的《硬件描述》文档。
分类
指示灯
正常状态描述
100W交流
POE电源模块
电源运行指示灯
SRU主控板
SYS
ACT
绿色慢闪
绿色常亮表示主用主控板;常灭表示备用主控板
蓝色常亮
•350W交流
电源模块
•350W直流
电源模块
STATUS
绿色常亮
PWR
TEMP
绿色常亮
绿色常亮
150W RPS电
源模块
FAN
绿色常亮
风扇模块
STATUS
绿色慢闪
OUTPUT
绿色常亮表示处于冷备份状态;绿色闪烁表示处于供电状态
接口卡
STAT
绿色慢闪(9ES2 、 4ES2G-S单板为绿色常亮)检查设备是否存在紧急或重要告警
登录到设备后,执行display alarm active命令检查设备中的告警状态,查看是否存在级别为Critical或
Major的告警信息。
<Huawei> display alarm active | include Major
A/B/C/D/E/F/G/H/I/J
A=Sequence, B=RootKindFlag(Independent|RootCause|nonRootCause)
C=Generating time, D=Clearing time
E=ID, F=Name, G=Level, H=State
I=Description information for locating(Para info, Reason info)
J=RootCause alarm sequence(Only for nonRootCause alarm)
1/Independent/2014-10-02 21:38:10/2014-10-02 21:39:00/0xff8c205c/hwCPUUtilizat
ionRising/Major/End/OID 1.3.6.1.4.1.2011.5.25.219.2.14.1 CPU utilization exceede
d the pre-alarm threshold.(Index=9, HwEntityPhysicalIndex=9, PhysicalName="SRU B
oard 0", EntityThresholdType=0, EntityThresholdWarning=80, EntityThresholdCurren
t=85, EntityTrapFaultID=144896)
告警级别按严重程度从高到低分为Critical、Major、Minor、Warning、Indeterminate、Cleared,在
日常维护中,对于Critical和Major级别告警需要及时进行处理。可参考本设备《告警处理》文档对告警进
行处理,如果无法解决,请及时联系代理商或华为企业业务技术支持热线。
如果部署有网管系统,也可以通过网管系统来检查设备是否存在告警,详细操作请
参考具体系统的使用说明。
5检查设备的健康状态
6
登录到设备后,执行display health命令检查设备的健康状态。
1
2
检查温度回显字段,查看在位的各单板温度状态(Status)是否均为NORMAL:
检查电源回显字段,查看在位的各电源模块的状态(State)是否均为Supply:
<Huawei> display health
-----------------------------------------------------------------------------------------------
Slot Card Sensor No. SensorName
Status Upper Lower Temp(C)
-----------------------------------------------------------------------------------------------
1 -
1 2FE TEMP NORMAL 75 0 41
2 -
1 1SA TEMP NORMAL 74 0 54
3 -
1 1CPOS-155M TEMP NORMAL 90 0 52
4 -
1 1ADSL-A/M TEMP NORMAL 70 0 49
5 -
1 8FE1GE TEMP NORMAL 85 0 57
8 -
1 1STM4 TEMP NORMAL 74 0 39
11 -
1 SRU40 TEMP NORMAL 70 0 52
如果发现异常,请检查机房温度是否正常、设备散热通道是否堵塞、设备的风扇模块是否工作正常,并
采取相应的处理措施。如果无法解决,请及时记录故障信息,并联系代理商或华为企业业务技术支持热
线。
--------------------------------------------------------------------------------------------
PowerNo Present Mode State Current(A) Voltage(V) Power(W)
--------------------------------------------------------------------------------------------
9 YES AC Supply N/A 12 350
10 NO N/A N/A N/A N/A N/A
如果发现异常,请检查电源模块的开关是否闭合、电源线缆是否松动,最后可尝试通过更换电源模块解
决故障。如果无法解决,请及时记录故障信息,并联系代理商或华为企业业务技术支持热线。
3 检查风扇回显字段,查看在位的各风扇的注册状态(Register )是否均为YES :
--------------------------------------------------------------------------------
FanId
FanNum Present Register Speed Mode
--------------------------------------------------------------------------------
12 [1-5] YES YES
35% AUTO
1 2130
2 2100
3 2100
4 2160
5 2130
如果发现异常,请检查风扇模块是否插牢、风扇叶是否被卡住或灰尘较多。如果是上述原因,可通过热
拔插风扇模块,清理风扇叶中的异物或灰尘等方式进行解决。如果不是上述原因,可尝试通过更换风扇
模块的方式进行解决。
如果无法解决,请及时记录故障信息,并联系代理商或华为企业业务技术支持热线。
AR100&AR120&AR150&AR160&AR200系列、AR100-S&AR110-
S&AR120-S&AR150-S&AR160-S&AR200-S系列以及AR510系列不支持查
看电源信息和风扇状态。4 检查CPU回显字段,查看在位的各单板的CPU使用率是否均低于80%:
System CPU Usage Information:
System cpu usage at 2014-10-10 22:02:50 250 ms
-------------------------------------------------------------------------------
SlotID CPU Usage Upper Limit
-------------------------------------------------------------------------------
2 4% 80%
3 3% 80%
5 4% 80%
8 4% 80%
11 16% 80%
如果发现CPU使用率过高,请观察一段时间(5~10分钟),如果一直处于高使用率状态,请及时联系
代理商或华为企业业务技术支持热线。
5 检查内存回显字段,查看在位的各单板内存使用率是否均低于60%:
System Memory Usage Information:
System memory usage at 2014-10-10 22:02:51 330 ms
-------------------------------------------------------------------------------------------------------
SlotID Total Memory(MB) Used Memory(MB) Used Percentage Upper Limit
-------------------------------------------------------------------------------------------------------
2 176 3 1% 95%
3 55 3 5% 90%
5 176 20 11% 95%
8 55 3 5% 90%
11 1400 353 25% 95%
如果发现内存使用率过高,请观察一段时间(5~10分钟),如果一直处于高使用率状态,请及时联系
代理商或华为企业业务技术支持热线。
6 检查存储介质回显字段,查看存储介质使用率是否超过80%:
System Disk Usage Information:
System disk usage at 2014-10-10 22:02:51 380 ms
----------------------------------------------------------------------------------------------------
SlotID Device Total Memory(MB) Used Memory(MB) Used Percentage
----------------------------------------------------------------------------------------------------
11 sd1: 1882 1033 54%
flash: 2 0 32%
如果发现存储介质使用率超过80%,请及时清理存储介质上的过时或不必要的文件,相应操作请参考
本设备的《配置指南-基础配置》文档。
7检查各单板状态是否正常
8
登录到设备后,执行display device 命令检查单板状态。
<Huawei> display device
AR2240's Device status:
Slot Sub Type Online Power Register Alarm Primary
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
1 - 2FE Present PowerOn Registered Normal NA
2 - 1SA Present PowerOn Registered Normal NA
3 - 1CPOS-155M Present PowerOn Registered Normal NA
4 - 1ADSL-A/M Present PowerOn Registered Normal NA
5 - 8FE1GE Present PowerOn
Registered Normal NA
6 - -
Present PowerOff
Unregistered -
NA
8 - 1STM4 Present PowerOn Registered Normal NA
11 - SRU40 Present PowerOn Registered Normal Master
9 - PWR350A Present PowerOn
Registered Normal NA
12 - FAN Present PowerOn
Registered Normal NA
请根据输出信息对各在位单板进行如下检查:
Online值是否为Present。
Power值是否为PowerOn 。
Register值是否为Registered。
Alarm值是否为Normal。
如果检查结果发现异常,请及时记录故障信息并及时联系代理商或华为企业业务技术支持热线。9
故障信息的收集和反馈
当检查中发现设备存在状态异常时,请及时收集故障信息,再采取后续的处理措施。
故障信息的收集主要包括如下几个方面:
故障基本信息:故障发生时间、故障具体现象、故障严重程度和影响的业务范围、故障点网络拓扑结
构、故障后已采取措施和结果等信息。
运行状态信息:发生故障的设备的名称、版本、当前配置、接口信息等。
设备日志信息:发生故障时产生的日志信息。
收集的信息请完整的反馈给代理商或华为技术支持工程师。
故障基本信息收集
出现故障时,首先需要采集的故障基础信息如下所示。
序号
收集项
收集方法
1
5
故障时间
故障现象
故障影响
组网信息
已采取的措施
记录发生故障的时间,精确到分钟。
收集故障现象并详细记录。
记录故障的严重程度和影响的业务范围。
画出组网图。主要包括上下行设备、对接接口等。
记录发生故障后已采取的措施和结果(包括完整的命令执行过程和输出信息)。
2
3
4
运行状态信息收集
登录到设备后,请执行display diagnostic-information 命令,一键式收集设备的运行信息,包括启动配
置、当前配置、接口信息、时间、系统版本等。
<Huawei> display diagnostic-information dia-info.txt
This operation will take several minutes, please wait.........................
................................................................................
........................
Info: The diagnostic information was saved to the device successfully.
生成的信息文件缺省保存在存储设备的根目录。您可以在用户视图下使用dir命令确认文件是否正确生成。
信息文件生成之后,您可以通过TFTP/FTP/SFTP等方式将文件传输到您的工作电脑,方便后续的查看
和反馈,详细操作方法请参考本设备《配置指南-基础配置》文档。10
设备日志信息收集
设备日志信息主要记录用户操作、系统故障、系统安全等信息,包括用户日志和诊断日志。登录到设备后,
您可通过如下方式获取用户日志和诊断日志信息:
<Huawei> save logfile
//收集普通用户日志
<Huawei> system-view
[Huawei] diagnose
[Huawei-diagnose] save diag-logfile
//收集设备诊断日志
[Huawei-diagnose] terminal diag-logging
//打开诊断日志的调试开关
[Huawei-diagnose] info-center create logbook sd1:/logfile/logbook.xml
//生成数据字典文件
执行完上述命令后,您可以通过TFTP/FTP/SFTP等方式将sd1:/logfile/目录下的所有文件传输到您的工
作电脑,方便后续的查看和反馈,详细操作方法请参考本设备《配置指南-基础配置》文档。
AR2220、 AR2240、AR3260、AR2220-S、AR2240-S、AR3260-S以及
NE16EX系列保存信息文件的根目录为sd1:/,其他款型的根目录为flash:/。无法登录设备的处理措施
如果发现无法通过Telnet/STelnet远程登录到设备进行操作,可以首先尝试通过Console(也称为串口)
登录到设备,检查并修改与Telnet/STelnet有关的配置。
如果通过Console口也无法登录设备,则无法进行任何与命令行有关的操作,需要进行应急处理,具体处
理步骤如下:
以下所有的处理步骤都基于一个前提,即用户的业务已经中断,因此不会造成进一
步的影响。如果用户业务并未中断,请不要进行以下的任何操作。您只需将故障信
息收集后,及时联系代理商或华为企业业务技术支持热线。
1 检查修复供电系统
如果发现设备所有的指示灯都不亮,并且设备的风扇不转(可通过听声音辨别),有可能是供电系统出
现故障。
1. 检查设备上或电源模块上的开关是否已经打开。如果有多个电源模块,请确保至少一个电源模块开
关打开,正常供电。
2. 检查电源模块PWR指示灯是否正常点亮。如果未点亮,表明电源模块输入异常,可通知电工检修
机房/机架/机柜的供电线路,恢复供电。
3. 检查电源模块电源运行指示灯是否正常点亮。如果未点亮,表明电源模块输出异常,可尝试通过更
换电源模块解决。
4. 检查电源模块STATUS指示灯是否异常点亮。如果点亮,表明电源模块有异常,可尝试通过更换电
源模块解决。
5. 如果以上检查都未发现问题,但设备仍无法正常加电,请及时联系代理商或华为企业业务技术支持
热线。
2 检查修改串口终端通信参数
请检查串口终端的通信参数是否与设备Console口的通信参数一致,如果不一致,请修改串口终端的通
信参数。
缺省情况下,设备的Console口通信参数为9600bps、8位数据位、1位停止位、无校验和无流控(如
有修改,以修改后的参数为准)。
113 拔插复位/更换主控板
排除了供电系统和串口通信方面的原因后,则很有可能是主控板发生了故障。如果设备有主备的两块主
控板,可尝试通过拔插方法复位主控板。如果只有一块主控板,可使用备件进行更换。
4 复位设备
拔插复位/更换主控板也无效后,可尝试复位设备来解决问题。复位设备可通过关闭设备开关、三分钟
后再打开设备开关的方法来实施。
5 寻求技术支持
上述方法均无效后,请及时联系代理商或华为企业业务技术支持热线,寻求技术支持。
12更多的参考资料
在您维护设备的过程中,如果您想获得更多维护方面的信息,您还可以:
信息
链接
浏览和查阅产品文档
产品文档
案例库-企业网络
华为企业互动社区
华为企业互动社区
在案例库中查阅相关案例
在知道社区中向专家提问
13
在技术论坛中发帖求助
更多推荐
华为AR系列快速维护指南
发布评论