FusionCompute
云计算平台故障处理指南
目录
前言 (ii)
1概述 (1)
1.1故障处理流程 (2)
1.2故障分类 (3)
2信息收集 (5)
2.1基本故障信息收集 (6)
2.2告警信息收集 (6)
2.3事件信息收集 (8)
2.4收集日志 (8)
3常见故障处理 (11)
3.1用户虚拟机故障 (12)
3.1.1虚拟机蓝屏 (12)
3.1.2SUSE 虚拟机网卡不可用 (14)
3.1.3Ubuntu10.04 及以上版本操作系统中uvp-monitor 进程未启动 (18)
3.1.4Windows Server 2003 虚拟机绑定USB 2.0 设备后,虚拟机黑屏或关机失败 (19)
3.1.5SUSE 10 虚拟机不能正常使用USB 2.0 设备 (20)
3.1.6重启或关闭主机网络服务后,主机网络异常 (21)
3.1.7虚拟机同时绑定SCSI 磁盘和IDE 磁盘时无法正常启动 (22)
3.1.8本地磁盘的ext4 文件系统损坏 (23)
3.1.9虚拟机内存数值显示异常 (25)
3.2管理节点故障 (26)
3.2.1VRM 虚拟机故障 (26)
3.2.2主机操作系统故障 (32)
3.3操作维护类故障 (35)
3.3.1登录界面时IE 浏览器异常 (36)
3.3.2FusionComute 无法获取监控数据 (38)
3.3.3修改虚拟机IP 后虚拟机通信中断 (40)
3.3.4主机管理网络配置与交换机不匹配 (42)
360云平台3.3.5异常掉电再上电后,任务长时间无响应 (43)
3.3.6网络数据残留导致添加主机失败 (44)
3.3.7仲裁IP 地址失效,导致Web 客户端无法登录 (46)
故障处理目录
3.4Tools 故障 (47)
3.4.1Windows 下安装Tools 时弹出警告提示 (47)
3.4.2Windows 下安装Tools 时异常中止 (48)
4部件更换 (50)
4.1部件更换策略 (51)
4.2更换主机 (53)
A 附录 (57)
A.1使用ISO 方式安装VRM 虚拟机 (58)
A.2清除FusionCompute 中本地硬盘的残留数据 (63)
A.3配置FusionCompute 告警上报 (64)
A.4配置单点登录 (66)
A.5如何处理虚拟机网卡乱序问题 (67)
A.6ISO 镜像方式安装主机 (68)
A.7配置IE 浏览器 (76)
A.8配置Firefox 浏览器 (79)
A.9登录FusionCompute (80)
A.10兼容性 (83)
B 术语 (94)
B.1A-E (95)
B.2F-J (96)
B.3K-O (97)
B.4 P-T (98)
B.5 U-Z (99)
1 概述关于本章
1.1故障处理流程
1.2故障分类
1.1故障处理流程
故障处理总体流程主要分为四个过程:故障信息收集、故障判断、故障定位、故障排
除。具体实施过程如图1-1所示。
说明
故障信息收集
处理重大故障前,请先联系技术支持处理。
图1-1 常见故障处理流程
故障信息是故障处理的重要依据,系统维护人员应尽可能多的收集故障信息。
故障判断
排除故障之前,系统维护人员根据收集的故障详细信息,对故障范围和类型进行判断。故障定位
故障定位是指从众多可能原因中出故障原因的过程。通过一定的方法或手段分析、比
较各种可能的故障成因,不断排除非可能因素,最终确定故障发生的具体原因。
以下是故障定位的常用方法:
●在管理界面查看告警信息
●在管理界面查看监控信息是否正常
●查询操作日志,分析操作过程是否有误
●在管理界面检查数据配置是否正确
●观察设备指示灯状态是否正常
故障排除
故障排除是指根据不同的故障原因清除故障的过程。故障排除包括检修线路、修改配置
数据、重启相关进程、重启服务器等。
说明
当系统维护人员无法自行排除故障时,请联系技术支持。
确认故障是否被排除
通过查询设备状态、查看设备指示灯和告警等方法确认系统已正常运行,并进行相关业
务调测以确保业务正常。
记录故障处理过程
故障排除后应记录故障处理要点,给出针对此类故障的防范和改进措施,避免同类故障
再次发生。
1.2故障分类
FusionCompute提供的故障处理如表1-1所示。
表1-1 故障处理一览表