|
机房运维一、概述 机房硬件运维工作,维护设备包含:网络交换机设备、网络安全防护设备、服务器设备、无线设备等。我司根据多年的项目实施和服务,积累了丰富硬件维护经验,根据本次项目特点,特制定如下运行维护解决方案。 二、服务内容 (一)服务目标 对用户现有硬件资源进行监控和管理,及时掌握硬件设备的运行状态,监测硬件设备的健康状态,创建一个可知可控的IT环境,从而保设备:可靠、高效、持续、安全运行。 服务项目围覆盖关键状态及参数指标: 1、运行状态、故障情况; 2、 配置信息; 3、可用性情况及健康状况性能指标。 (二)前期工作 1、派出硬件工程师前往客户现场,对现场相关设备进行测试,测试依据,以厂商操作手册为标准进行数据收集,并对运行情况做好文档记录。然后对设备进行必要的清洁、保养和维护,使设备处于良好的运行状态。 2、施工交底 依据合同明确服务标准、工作流程、联系方式; 3、建立设备档案 详细记录设备型号、出厂编号、版本号、工作状态; 4、场地环境检查 包括供电装置、电源电压、接地和室内湿度、温度、温变梯 度、空气洁净度、防雷措施等进行检查,对问题隐患提出改进建议; 三、巡检 (一)巡查内容 定期巡检的目的在于及时发现和预防可能出现的硬件和系统问题,从而在最大程度上为系统的连续稳定运行提供保证,巡检工作主要包括: 1、主机系统的运行状态,对系统CPU、内存、I/O状态、进程等检查; 2、外部设备运行状态,对磁盘阵列、光驱、维护终端等的状态、设置进行检查;对风扇、后备电池、磁盘、键盘等敏感部件进行重点检查,如有故障征兆则进行先期更换; 3、连接件检查,对连接插头、电缆、电源插座等进行检查; 4、环境检查,包括电源电压、接地和室内温度、湿度、空气洁净度等; 5、技术交流,双方技术人员分析和解决日常运行中出现的未解决问题; 6、工作报告,在对系统进行全面的检查后,给出详细的报告,根据检查结果给出相应建议和改进方案。 (二)巡查周期 提供5×8技术支持服务,并根据甲方的需要提供现场支持服务。具体服务时间由甲方需求决定。 1、根据甲方的需要提供现场支持服务。 2、每月一次例行巡检即预防性维护并提供例行巡检报告; 3、每次硬件故障处理后提供硬件处理和备件更换报告; 4、每季度一次全面性检查,全面检查硬件系统的工作状态、对硬件系统的运行环境进行评估、现场解答有关硬件技术方面的问题、硬件可用率、故障分布和维修类型状况,并交付硬件系统健康检查报告书,针对设备的运行状况,提出设备的配置和参数设定等方面优化建议; 5、乙方在服务年度期满前十五天应通知甲方,并完成年度现场维护,提供年度服务总结报告,方便贵单位控制和管理。 运维服务流程
四、服务管理 (一)服务时间 1、接收服务请求和咨询: 在5 * 8 小时工作时间技术工程师驻守现场,接听服务请求,并记录服务事件处理结果。 2、服务响应时间:
技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。 对于“I级”的故障级别,如果2小时内无法解决故障,将采用替换业务主机的方案,确保业务系统的运行。故障解决后24小时,提交故障处理报告,说明故障种类、故障原因、故障解决中使用的方法及故障。 (二)现场服务支持 1、现场出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。 2、故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应介绍故障出现的原因及预防方法。 下一篇工厂线边库 |


