单位文秘网 2022-02-23 08:09:53 点击: 次
摘 要 长江宜宾航道局标准化机房的运维管理涉及硬件、软件、监控、环境、网络安全等方面,本文将结合自身管理经验,对如何加强网络中心机房的运维和管理进行探讨,提出几点可行性建议,增强管理的时效性。
关键词 机房;运维;管理
引言
随着长江干线数字航道四川段的建设,长江宜宾航道局机房已参照二级标准化机房建设并投入运行,标准化机房的运维管理涉及硬件、软件、监控、环境、网络安全等各方面,这就需要我们加强机房的运维和管理,规范运维行为,保障系统安全、稳定、高效运行。
1 机房运行环境要求
首先是要有良好的运行环境。主机房内绝缘体的静电电位不应大于lkV,机房地面的静电泄漏电阻和絕缘体的静电电位也要符合相关的规定。机房各区域内的温度、湿度等环境条件应严格控制,以提供可连续运行的温度和湿度。一般空调夏季温度设置为23士2℃,冬季设置为20士2℃,湿度在45%—65%之间,同时应安装通风换气设备,使机房有一个清新的操作环境。除了温度和相对湿度的要求外,中心机房的空调还有必要具有除尘与空气净化的功用,远离腐蚀气体、易燃易爆物,各区域内应清洁、少尘、无悬浮颗粒物,无积水,无异味[1]。
2 提高运维管理的手段
2.1 坚持机房日常巡视
巡视由机房管理员负责,完成规定的日常操作和故障监测记录、简单故障的排除,具体内容如下:
(1)机房环境的巡视:机房门、窗、灯光、卫生状况。查看机房环境监测系统有无报警,根据系统监测的温度、湿度、基础设施数据、故障发生情况等采取措施。
(2)机房设备的巡视:对机房的UPS、空调、消防等系统的运行情况进行日常巡视,密切注意工作负荷、电池容量、室内温湿度等数值,以保证网络安全、正常的运行;UPS电池的状况;设备的开关、连线、插头插座等是否正常,有无错位、松动;设备的各种指示灯和运行状况等。
(3)信息系统的巡视:对服务器及信息系统的运行情况进行日常巡视,查看各个系统是否能正常访问。
(4)通信链路巡视:对路由器、交换机等进行日常巡视,信号灯指示是否正常,检测内、外网络是否正常,网络有无丢包、掉包现象。
2.2 加强机房基础设施的维护保养
机房基础设施的维护保养要做到以下几点:①配电柜一年进行一次维护保养,内容包括清扫灰尘,检查各接点、触点的温度、松紧。②UPS一年进行一次维护保养,内容包括:清扫灰尘、检查UPS逆变器工作状况及UPS整机的工作状况,检查电池组机每节电池的状况。③机房精密空调每半年进行一次维护保养,内容包括:清扫及更换各过滤网、清洗或更换加湿罐、清扫室外机、测量工作压力、测量工作电压、电流、检查下水管道是否畅通及漏水报警是否正常、进行软化水更换。④机房消防系统每年委托专业机构进行检测,内容包括:对机房的消防报警主体、气体瓶组、烟感、温感等设备定期检查,对损坏、不良线路或设备等及时更换。⑤机房每年还进行一次专业保洁,对机房的地板进行调整和清洁、对底板下、天棚板上进行清洁。
2.3 做好机房日志记录
日志是机房管理及维护的“监控者”,一般分为以下几类:①日常巡检日志,主要是对机房进行日常巡查记录,包括温湿度、市电供应情况、UPS状态、消防设备状态、信息系运行情况等;②机房出入日志,记录了进出入机房人员的姓名、时间、事由以及陪同人员。③系统运行日志,主要是对OA办公系统、经管等办公应用系统的日常运行情况进行记录,由系统自动生成,方便机房管理人员能够及时了解当前系统的运行状态和出错详情。④灾备日志。日志记录这些灾备的情况,包括备份的大小、时间、份数、位置以及所含的程序等,有利于在紧急情况下缩短查找备份的时间,恢复预定备份。
2.4 加强网络安全管理
(1)安装网络安全设备。安装防火墙,漏扫、入侵防御系统等,从硬件上保证网络安全。定期检查设备,是否有黑客入侵行为,及时做好更新升级工作,确保安全设备正常运行。
(2)定时更新防病毒软件。计算机病毒产生非常快,具有较强的传染性和破坏性,需加强对客户端的防病毒软件进行管理,定时更新病毒库。对常用软件及操作系统进行定期补丁更新,防止安全漏洞遭到病毒袭击。
(3)做好内网和互联网的物理隔离。从通信线路上做好内、外网交换机的物理隔离。机房中通过内网连接的服务器及其他网络设备,统一分配、绑定IP地址。
(4)机房管理人员应严格遵循《中华人民共和国网络安全法》等有关规定,提高网络安全意识。机房内所有设备应设有系统登录密码,管理人员操作后应将服务器处于锁定状态。非机房管理人员不得私自操作任何设备,严禁私自拷贝数据。需要在机房作业时必须有机房管理人员陪同。
2.5 提高机房管理人员水平
机房的运维管理目前还是以智能监控为辅,人员管理为主的一项工作,因此,提高机房管理人员水平尤为重要。 一是增强责任心,提高服务意识。二是具有良好的专业技能和职业素养,在硬件技术及软件技术两个方面下功夫。软件方面主要是指通过做好系统还原,重要数据备份等方式;硬件方面主要是对硬件的故障有正确的判断,然后采用与之相应的方式维护。三是机房管理员应掌握机房应急处理措施,了解机房内部的电力设施操作规程及应急措施;熟悉消防安全操作和规则,了解消防设备操作原理、掌握消防应急处理措施。
2.6 搭建运维管理服务平台
要提高机房的运维管理效率,往往需要借助运维管理系统来实现,通过系统可以统筹数据中心管理、IT支撑平台管理、业务监控管理、运维服务流程管理、灾备管理等内容。通过可视化展示各种监控对象性能指标、告警、信息的实时状态和变化趋势,实现可视、可管、可控一体化管理,配合数字航道分中心7×24小时运行值守,全面提升运维技术支能力[2]。
3 结束语
机房的运维管理是一个系统性的工作,需要以完善的运维服务制度、流程为基础,以先进的、成熟的运维管理平台为手段,以高素质的运维服务队伍为保障, 提高机房运行维护科学化、规范化水平,切实保障机房基础设施及软硬件系统的安全、可靠、连续、稳定工作。
参考文献
[1] 韩景月.计算机网络中心机房建设分析设[J].计算机产品与流通,2017,(12):85.
[2] 彭嘉.现代网络中心机房规划与设计[J].福建建筑,2016,(9):102-106.
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-251-101163-1.html
上一篇:工厂化检修精益管理研究
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用