机房巡检工作总结
1机房年度巡检工作总结
一、idc的日常工作和巡检的自我总结:
在日常巡检的过程中,认真仔细的检查动力机房的空调,ups,油机等数据,并认真做好巡检记录,与之前的巡检记录进行对比,发现异常后马上与值班长沟通,如果确认为故障则马上上报网监中心。在巡检过程中做到随手关灯,做好节能减排工作。
在十一月份中,机房发生了两次事故,第一次事故我休假回家,第二次事故是我值班,后半夜三点多钟的时候。因为迟了十分钟接到电话,我感到很内疚,自己的工作没有做好。在发生故障之后,在主管和xx的帮助之下重启了空调主机。经过这次事故,我学到了很多经验,以后再发生万一的时候就不会不知所措。以后巡检的时候也会更加仔细,认真。在后半夜的巡检中,也会每隔一段时间就会一楼查看空调主机工作状态是否正常。发生故障的时候也会更加镇定,及时处理故障,与上级沟通。
在idc机房责任分工制度中我负责的五楼托管机房的一些问题中,我也及时的与工程公司沟通过,安全出口指示灯以及紧急照明灯都已经修复好,只剩下气瓶室的防火泥没有封堵。我会继续跟进,及时上报。
二、下个月的工作计划:
在十二月份的工作中,巡检的时候更加仔细认真,做好本职工作,保证机房安全。发现问题及时与主管与xx沟通。
2201X年机房巡检年度总结
时光飞逝,转瞬间20XX年已经过去,应中国移动成都分公司无线中心相关领导的指令,根据《移动机房巡检细则》,我部门对成都市移动机房相关BSC设备设施进行了定时、定量的安全巡检。现对20XX年巡检结果总结如下:
一、机房BSC网元硬件巡检
机房BSC网元硬件巡检主要检查网元板件指示灯,一些板件是否插入对应槽位以及电源模块的巡检。由于网元板件的一些故障不能再终端上体现,所要现场查看,防止故障的放生。
由于未插入板件是网元改造后遗留在网元上,对网元业务毫无影响,可以不考虑,而下电网元则已下电退网,也可以不考虑。所以我们除去其中的下电网元和未插入板件的4起故障,将DPROC、XCDR、GDP、GDP2、MSI等串口板故障相加,则其占70%,而电源模块的故障占6%,LANX、KSWX、GPROC3-2、GCLK等核心板件故障占24%。这些数字说明串口板在巡检故障中占绝大部分,而并不能说明串口板发生故障远远大于核心板件,因为巡检故障是针对自查故障和派单故障的弥补。而核心板件故障都是对业务影响大的故障,监控系统会第一时间发现并下派工单。所以在巡检中才会出现核心板件故障远远少于串口板。
二、机房网元标签巡检
机房标签巡检主要是检查机柜及DDF架的标签。由于时间过长,机房内风扇等原因导致标签的脱落,巡检主要目的是将发现的这些问题标签进行重贴和加固。20XX年春节之后,我维护部门针对各个机房的资产标签、资源清查标签、网元标签进行了整体巡检,对于各种已脱落标签、将要脱落的标签、粘贴不牢固的标签以及临时标签进行了统一处理,对已脱落标签、将要脱落的标签、粘贴不牢固的标签进行了重新黏贴和加固,对临时标签进行了更换。并每个月都会对各个机房的标签进行详细检查,发现问题立即处理。以保证网元标签正常。
三、机房设备巡检
机柜设施巡检主要是检查机柜设施,防止由于机柜的损坏导致的网元故障。由于各种设施设备的老化以及施工等原因,造成设施设备故障。而我维护部门没有处理这些故障的设备和材料,所以对于这些问题只能做到临时处理。
四、机房环境标签巡检
机柜设施巡检主要是检查机柜设施,防止由于机柜的损坏导致的网元故障。地板托架问题属于设施问题,我维护部门没有该设施专业维护人员和维护所需设备及耗材,所以无法处理。
总结:再20XX年机房巡检中,共巡检出硬件故障50起,出去对业务和安全毫无影响的4起外全部处理。共重贴标签98个。巡检出设备故障25起,处理18起,其他7起处故障处理需要专用设备,故而未处理。在巡检中发现6个机房存在安全隐患,其部分地板托架损坏。
3201X年机房安全巡检总结报告
安全检查是安全管理的重要内容,是识别和发现不安全因素,揭示和消除事故隐患,加强防护措施,预防故障的重要手段。机房安全巡检是对日常维护的补充,可以进一步提高维护分析工作的时效性、纵向深入性及横向联合性,把机房维护等基础管理工作进一步规范化、标准化,是为今后进一步做好维护工作打下基础。机房安全巡检包含机房环境检查和设备告警检查两大部分。机房环境检查是检查设备所处环境是否达标,有无存在安全隐患,各种标签有无脱落。设备告警检查是查看设备的各种告警,从而及时处理各种故障,解决设备存在的隐性隐患问题检查设备工作环境、标签、状态进行历史告警、现网告警分析及处理定期对机房内所有王元进行温度巡检网元入网验收,退网报备网元标签巡检网元标签巡检标签检查:网元标签是网元的重要标示,它关系到资管系统正确与否,也关系到维护的安全。成都市内共有BSC机房15个,设备195套,机柜237个。标签巡检是保证每套设备、每个机柜级DDF架、ODF架标签正常无脱落。20XX年机房巡检黏贴脱落标签68个,并将所有网元标间进行了加固处理。
机房环境巡检机房环境巡检机房环境:BSC设备的工作与环境有重要关系,而我们主要检查机房环境是否达标,主要内容是夏季设备降暑、冬季设备电源排查,杂物清理等。20XX年共巡检故障5次,解决出隐患问题8起。
20XX年,BSC网元共退网22套,下电59套,入网36套。网元入网验收为重中之重,我们对每个即将入网的网元进行规范外观、数据核查、告警清理、硬件检测、拨打测试等检验,以确保网元零风险入网。截止12月低,已验收网元36套。其中8套网元发现标签不规范,3套网元存在残留告警,经重新调测后,复验合格。
BSC入、退网清单华为入网(套)诺西入网(套)退网网元温度巡检温度巡检在日常巡检中,加强了对各网元的温度巡检。使用了专业的红外成像仪,能够准确的显示出在某一范围内,各网元、硬件的最高温度,最低温度和平均温度。这一仪器使用,更有效的帮助我们排除网元的隐患故障,减少事故的发生率。红外成像仪所呈现的图像可以准确的表示出各硬件的最高温度,最低温度和某一范围内的平均温度。便于了我们对某些温度不在正常范围内的硬件进行及时的更换,排除隐患故障。
在巡检中发现BSC338、BSC348、BSC339、BSC349板件温度偏高,并立即与机房管理人员联系处理,在网元上方新增空调出风口,降低了网元板件温度。当前告警巡检当前告警巡检从20XX年下半年,机房安全巡检加入网元告警分析及处理。设备告警巡检主要包括现在当前告警检查与历史告警分析。当前告警主要是检查设备当前状态,是否存在故障,及时解决。历史告警分析则是对实时告警检查的补充,因为设备的一些软件告警总是造成“闪断”现象,实时告警不能及时发现。所以我们通过历史告警的分析,查出此类隐患故障,及时解决。当前告警巡检是发现设备故障的重要手段,所以我BSC维护组每天对设备进行三次实时告警提取分析。下半年共查出当前告警132起。其中43起未被监控派单,并且在有些故障在派单之前我们已经检查到,并开始处理,所以在派单之后的很短时间内处理完成。这也大大减少了无线中心的一、二级告警处理时间。