机房停电应急预案
第1篇:机房停电应急预案
应急预案指面对突发事件如自然灾害、重特大事故、环境公害及人为破坏的应急管理、指挥、救援计划等。以下是小编整理好的机房停电应急预案,欢迎大家阅读参考!
机房安全应急预案【1】
机房是我单位的重要场所,重要仪器、设备相对集中,一旦发生事故,会造成严重后果。为此特制定本应急预案。
一、触电
(1)一旦发生触电事故,应迅速安全切断电源,切忌直接接触触电者。
(2)即刻拨打紧急电话120并通知相关领导,同时开展现场应急救护。
二、火灾
1、报警程序:
即刻通知领导及相关部门,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119).。
2、组织实施:
机房管理员一旦发现火情后,应即刻切断电源,并使用灭火器扑救起火设备。
三、空调漏水
若空调系统出现渗漏水,应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时临时用电扇进行降温。
四、设备发生被盗或人为损害事件
(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告中心负责人,同时保护好现场。
(2)中心负责人接报后,通知保卫处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
(3)当事人应当积极配合公安部门进行调查,并将有关情况向领导汇报。
五、机房停电
(1)接到长时间停电通知后,应及时发布相关信息,部署应对具体措施。
(2)如遇临时停电,且停电时间在3小时之内,管理员要检查UPS是否正常工作,以确保机房设备的正常运行。
六、网络故障
(1)发生通信线路中断、路由故障、流量异常等故障后,网络管理员应及时查清通信网络故障位置,隔离故障区域,组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
(2)事态或后果严重的,应及时报告领导并请求协助解决。
七、不良信息和病毒事件
(1)发现不良信息或网络病毒时,管理员应立即断开网线,终止不良信息或网络病毒传播,并报告。
(2)中心负责技术人员应采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。
(3)事态或后果严重的,应及时报告相关领导以及相关部门。
八、服务器软件系统故障
(1)发生服务器软件系统故障后,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;
(2)若重启失败,应立即安排备份服务器启用,并请求技术人员支援,作好技术处理。
九、注意事项:
第一、机房管理员要加强日常监控,及时处理、消除及上报安全隐患。
第二、备齐安全相关装备。
第三、及时做好备份。
网络及机房故障应急预案【2】
为科学应对网络与信息安全突发事件,提高信息中心机房处理突发信息网络事件的能力,建立健全信息安全应急机制,有效预防、及时控制和最大限度地消除信息安全各类突发事件的危害和影响,特制订网络及教育技术中心机房故障应急预案。
本预案坚持“统一领导、协调配合、明确责任、依法规范、条块结合、整合资源、防范为主、加强监控”的原则。适用于网络及教育技术中心机房可能发生的网络与信息安全突发事件。
一、设备发生被盗或人为损害事件应急预案
⑴ 发生设备被盗或有人为损害设备情况时,使用者或管理者应立即报告科长,同时保护好现场。
⑵ 科长接报后,应立即报告处长,并通知安全公安处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
⑶ 事件当事人应当积极配合公安部门进行调查,并将有关情况向科长和处长汇报。
二、机房停电应急预案
⑴ 接到停电通知或遇不可预知的停电后,应立即报告科长,并通过网站发布或电话通知停电通告。
⑵ 停电已经发生,应立即检查机房供电情况,如UPS是否正常供电,设备是否出现关机等情况,并积极查看机房当前温度情况。
⑶ 机房温度超过30度且制冷空调无法开启,积极组织人员开始对次要设备进行关机。
⑷ 机房温度超过35度且制冷空调无法开启,积极组织人员开始对绝大部分设备进行关机。
⑸ 机房来电后先与物业部门确认供电是否恢复正常,如完全正常,先开制冷空调,并根据设备关机的反序开机,并检查各项服务是否正常开启。
三、网络故障应急预案
⑴发生通信网络故障后,网络管理员应第一时间明确网络故障的位置和程度,及时给科长汇报,并隔离故障区域,切断故障区与服务器的网络联接。
⑵针对故障原因,网络管理员及时制定故障解决预案,并报上级领导批准,情况严重时告知相关通信网络运营商,请求协助查清原因。
⑶网络管理员会同电信技术人员或公司技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。
⑷网络管理员以及关责任人负责写出故障分析报告,上报上级领导备案。
四、不良信息和网络病毒事件应急预案
⑴当发现不良信息或网络病毒时,网络管理员应立即断开该处网络,第一时间给上级领导汇报,并终止不良信息或网络病毒传播。
⑵立即通告局域网内所有计算机用户防病毒方法,隔离网络,指导各计算机操作人员进行杀毒处理,直至网络处于安全状态。
⑶对不良信息要进一步追查来源,对未经相关领导同意擅自发布信息,造成不良影响且触犯法律者,移交执法部门追究法律责任。
⑷情况严重时,应立即向上级领导报告,请求支援,作好应对措施。
五、黑客攻击事件应急预案
⑴当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,及时给网络管理人员报告,网络管理员接到报告后立即给上级领导汇报。
⑵接到报告后,网络管理员立即关闭网络,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。
⑶及时清理系统、恢复数据、程序,尽力将系统和网络恢复正常;情况严重时,应立即级领导报告,请求支援,作好应对措施。
六、机房设备硬件故障应急预案
⑴发生机房设备硬件故障后,网络管理员立即确定故障设备及故障原因,并及时给领导汇报,制定处理预案。
⑵若故障设备在短时间内无法修复,应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。
⑶故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,应立即级领导报告,请求支援,作好应对措施。
七、应急处置
发生信息网络突发事件后,网络管理人员应在第一时间内向上级领导报告,并且成立应急小组,组织人员开展先期处置。发生重大事件应向上级领导部门报告。
第2篇:机房停电应急预案
机房停电事件应急预案
1.总则 1.1目的为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对公司各部门的影响,特制定《杭州博日有限公司机房停电事件应急预案》(以下简称预案)。1.2工作原则
(1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。(2)快速反应。发生突发事件时,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。
(4)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。1.3适用范围
所有机房临时停电,突发停电以及较长时间停电的事件。2.组织机构及职责
2.1组织机构(联系人名单及联系方式每半年更新一次)设备计量课 主要联系人及联系方式 Helpdesk:分机:XXXX。(7 X 24工作)各主要设备供应商联系人及联系方式: 2.2各组织机构职责
1)设备计量课应尽可能及时通知所有部门停电信息,且准备好应急措施。
2).设备计量课应及时做好停电应急措施,通知各相关部门做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,设备计量课所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。
3.设备计量课应急预案
3.1机房长时间停电应急预案
⑴ 接到长时间停电通知后,应询问停电原因及具体停电时间并及时通过邮件发布或电话通知停电公告,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。⑵ 根据停电时间长短情况,协同有关部门部署应急措施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。
(3)对机房设备用电做好统计,做好拉闸限电预案。
(4)各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。(5)通知相关部门,停电期间加强对存在安全隐患的设备及区域的巡查(如电梯间,水房等),保障公司人员和财产安全。
(6)机房管理人员详细记录事件原因及此期间采取的应急措施,备案。3.2 机房突发性临时停电应急预案
(1)相关人员发现突发性停电时应立即报告部门领导,及时了解停电原因及停电时间,并立即检查机房设备是否运行正常,检查各系统是否运行正常,同时查询机房设备相关记录,计算UPS当前状况下可供电时间,并向相关部门领导汇报。(2)告知各业务部门停电相关信息,判断停电时间长短做好相应应急措施,提醒各部门做好数据备份以防万一。
(3)通知相关部门检查存在重大安全隐患的设备运行情况(譬如电梯,水房等),保障公司人员和财产安全。
(4)通知IT部门机房管理人员及机房设施相关人员进入紧急待命状态。
(5)恢复正常后,查明停电原因,记入机房安全管理日志。4.培训和演习4.1培训
IT运维部门及机房相关人员每年至少开展一次机房停电等突发事件处理的培训,提高机房管理人员及其相关人员的应急能力。4.2预案演习
各应急组织机构每年至少安排一次演练,通过演练发现应急工作体系和工作机制以及各备用设备,系统存在的问题,不断完善应急预案,提高应急处理能力。
5.附则
5.1预案更新
本预案结合演练和实施情况,及时进行修订和完善。5.2责任与奖惩
各应急机构对在应急事件处置中作出突出贡献的集体和个人,提出表扬和奖励;对玩忽职守,造成不良影响或严重后果的,按有关规定提出处理意见,并追究其责任。5.3制定和解释
本预案由设备计量课制定并解释。5.4本预案实施或生效时间
本预案制定后提交部门讨论,审批通过后执行。
第3篇:通信机房停电应急预案
核心机房电力的保障一直是维护体系的头等重要事项,通过实施应急发电演练,建立了可靠的应急预案机制,最大限度的降低电源中断对网络传输质量的影响。现分享核心机房电源中断应急预案,希望分公司尽快建立一套统一指挥、职责明确、反应迅速、处置有力的机房安全保障机制。
组织架构:
责任领导、工程维护、网络监控、网络运维、质量管理等相关人员。
机房电源系统说明:
1、机房电力是两路三相四线制供电,进线线缆规格为:RVV50*4+16*1铜芯护套线。
2、机房电源系统采用三级防雷系统,三级防雷分别位于电源进线端、UPS输入前端。
3、机房现有两台60KVA-UPS电源,均处于正常运行状态。
4、机房现有设备机柜已编号,均通过UPS电源和市电供电,每个机柜有独立的20A空气开关。空调、墙壁插座开关、应急灯、照明等都是单独空开接市电。
5、运行中的UPS电源所带负荷,在逆变运行状态下能正常工作约4小时(已经过UPS放电测试)。
一、核心机房电源中断预案
1、在接到停电通知的情况下:
1)计划性停电通知要确保综合部、工维机房管理部对口人接到通知(提前将对口联系人备案在物业处),机房管理员接到计划停电通知后,升级到调度中心进行信息发送,同步进行邮件通知相应应急小组成员。并与负责组长及责任领导电话告知,确保已经接收到本次停电的时间及可能发生的情况。
2)维部进行发电应急预案小组成员通知,提前做好机房发电预案要求的准备工作,将相应的发电机、连接线、人员安排到位,各司其职,随时待命现场,做发电准备工作。确保停电时刻的电力安全及机房用电的保障措施,提前调度安排好相应人员做好保障用电的措施。
3)计划停电时间开始后,马上启动应急发电操作,按照机房发电操作步骤实施阶梯供电的步骤,恢复市电保障。并进行现场值守及设备工作确认,确保全部正常后电话告知调度中心及维护体系领导。
2、在没有接到任何通知,突然发生停电的情况下:
确认停电线路,停电时刻,停电时间等要素,启动核心机房发电应急预案。
1)值班网管工作流程:
⑴值班网管监控到核心机房停电,第一时间告知工维部、网络部、运维部应急小组组长。信息传达到工维部机房管理员(一主一备),告知停电开始时间。
要求在停电5分钟内将消息传达到调度中心,各应急小组组长。如无法联系上,进行升级到责任领导-工维部经理经理处。
⑵网管将停电信息电话传达后,进行调度派单,确保全部的应急小组成员都收到本次故障停电的信息。然后进行机房中设备的检查,包括:UPS设备主机、各核心设备、汇聚设备、服务器、语音系统等。检查是否受影响。同时启动机房降温措施(降温方案:初步为加装抽排风设备、增加大风扇排风形成热量流动降温)
⑶实时监控设备及UPS工作情况,包括:电量下降情况,设备工作正常情况,每15分钟通报一次电量情况。
2)运维部应急工作流程:
⑴运维应急同事接到故障通告后,第一时间往停电现场赶,到现场配合网管/工维部门进行设备仪器的检查、客服语音系统的保障,应急发电的协助。
⑵现场配合进行机房降温散热措施实施,实时检查网络设备的工作情况。
3)运营质量管理应急工作流程:
⑴调度中心值班人员接到网管监控调度信息后,第一时间将故障信息记录并发故障通告到相关应急成员,并电话通知各应急小组组长是否知悉。
⑵进行客服调度系统的设备工作运行系统检查,特别语音系统级坐席电脑,是否有问题,如发现工作系统有异常,及时与运维应急小组成员沟通,进行检查处理。
⑶实时关注故障工单流程进度登记,配合应急小组进行人员调度通告。
4)工维部应急工作流程:
⑴机房管理员第一时间往停电现场赶,同时进行电话沟通供电公司、物业方等,咨询停电原因,是属于计划性还是突发性停电,预计停电时长,将咨询清楚的结果反馈到应急小组成员中,电话联系物业沟通好需要发电需求申请。
⑵工维应急小组组长接到时间后第一时间往停电现场赶,同时进行发电应急小组成员调度,安排第一时间到场工作开展,并升级通报告知主管领导,对口集团维护中心上报信息。
⑶工维应急小组成员接到停电时间后第一时间往停电现场赶,要求30分钟内必须到场(住机房附近的人员往现场去,较远同事可以进行打车往现场去),先行到处同事配合网管、运维同事启动做好应急发电前的准备:连接线布放、接续、发电机发电前检测油/电/水路检查,确保正常。确保一切就绪后,确认可以进行发电操作后,按照发电操作流程进行发电恢复市电。
⑷网管将监控到停电的相应信息及级别同步发送到运营质量管理部调度岗,由调度岗将相应信息进行工维、运维、网络关联同事进行信息告知,同时报工维主管领导知悉。
5)应急机房发电操作流程:
⑴机房用电系统包括四方面:空调制冷、主/备UPS主机、照明系统、客服调度系统。
⑵发电前考虑4方面系统设备用电功率情况,为保障发电机带动的正常,不能进行同步供电,要区分优先恢复的步骤实施,确认发电机的工作正常。在发电前将需要供电的“空调制冷、主/备UPS主机、照明系统、客服调度系统”的市电输入主开关关闭。防止同步启动时发电机的无法供电保证。
⑶启动发电机,检测发电输出电流通断,待发电机运行稳定后。
第一步启动空调制冷系统的市电输入开关,运维应急小组成员重新启动空调主机(空调因为市电恢复后需要重新启动)观察空调制冷工作是否正常。
第二步启动主UPS设备的市电输入开关,观察发电机运行稳定情况,主UPS主机工作稳定情况,网络设备的工作正常与否。
第三步启动客服系统的市电输入开关,包括(客服坐席电脑、UPS设备、空调制冷等),观察发电机运行稳定情况,设备恢复工作情况。
第四步启动备UPS设备、市电照明的市电输入开关,观察发电机运行稳定情况,备UPS主机工作稳定情况,网络设备的工作正常与否。
⑷发电机启动,市电输入正常后,网管将降温系统的抽排风设备关闭,与运维同事进行所有设备的运行进行全面的检查,确保设备已经是运行正常。
⑸发电机发起市电正常后,工维应急小组安排专人现场值守,及时关注发电机油量情况,同时与油品供应商确认油品配送要求及时间要求,并实时与供电部门确认市电恢复时间。
6)停电过程中突发事项预防:
⑴网管在停电时进行机房确认运行中的UPS工作组、设备组工作状态。主/备UPS工作切换是否正常,在市电中断时UPS是否已经开始进行供电保护。
⑵值班网管对机房中的所有设备进行全面检查,确保所有的设备已经是有主备供电,市电中断后UPS已经正常保障设备工作。同时对机房的温度进行观察,温度是否突然升高。
⑶停电后,UPS处于逆变工作状态,当班人员要每隔15分钟观察一次UPS的蓄电池容量、带负荷情况、机房环境温度,尽量使蓄电池容量大于60%,带负荷小于85%(因为已经有自购发电机应急,尽快要求短时间发起电,减少UPS的放电过度)。
⑷发现机房环境温度大于26℃。当以上指标不能保证时,要及时向机房管理员汇报,同时上报责任领导知悉,网管预案小组成员经过慎重讨论,适时采取关闭不必要网络的网络设备、加强通风降温等措施尽量延长关键设备运行时间。
第4篇:机房停电事件应急预案
XXXXXX机房停电应急预案(V 1.0)运维
IT 2008-11-4
目 录 1.总则.................................................................................3 1.1目的.........................................................................3 1.2工作原则.................................................................3 1.3适用范围.................................................................3 2.组织机构及职责.............................................................3 2.1组织机构.................................................................3 2.2各组织机构职责......................................................4 3.IT部门应急预案..........................................................4 3.1机房长时间停电应急预案....错误!未定义书签。3.2机房突发性临时停电应急预案错误!未定义书签。4.培训和演习...................................................................5 4.1培训.........................................................................5 4.2预案演习.................................................................5 5.附则...............................................................................5 5.1预案更新.................................................................5 5.2责任与奖惩..............................................................5 5.3制定和解释..............................................................5 5.4本预案实施或生效时间..........................................5
2 机房停电事件应急预案
1.总则 1.1目的为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对公司各部门的影响,参照《XXXX数据中心突发事件应急处理程序V2.1》,特制定《XXXX 机房停电事件应急预案》(以下简称预案)。
1.2工作原则
(1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。
(2)快速反应。发生突发事件时,《XXXX数据中心突发事件应急处理程序V2.1》,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。
(4)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。
1.3适用范围
所有机房临时停电,突发停电以及较长时间停电的事件。
2.组织机构及职责
2.1组织机构(联系人名单及联系方式每半年更新一次)
规划运营:主要联系人及联系方式: IT 主要联系人及联系方式
3 Helpdesk:分机:XXXX。(7 X 24工作)各主要设备供应商联系人及联系方式:
2.2各组织机构职责
1).规划运营部门应尽可能及时通知所有部门停电信息,且准备好应急措施,若需要柴油发电机工作应提前检查柴油机性能,输出电压是否稳定以及柴油等辅助设备是否充足。
2).IT部门应及时做好停电应急措施,通知各相关部门做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,IT所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。
3.IT部门应急预案
3.1机房长时间停电应急预案
⑴ 接到长时间停电通知后,应询问停电原因及具体停电时间并及时通过System Helpdesk发布或电话通知停电公告,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。
⑵ 根据停电时间长短情况,协同规划运营部门部署应急措 4 施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。
(3)对机房设备用电做好统计,做好拉闸限电预案。(4)各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。
(5)通知相关部门,停电期间加强对存在安全隐患的设备及区域的巡查(如电梯间,水房等),保障公司人员和财产安全。
(6)机房管理人员详细记录事件原因及此期间采取的应急措施,备案。
3.2 机房突发性临时停电应急预案
(1)相关人员发现突发性停电时应立即报告部门领导,及时了解停电原因及停电时间,并立即检查机房UPS及其它设备是否运行正常,检查各系统是否运行正常,同时查询机房设备相关记录,计算UPS当前状况下可供电时间,并向相关部门领导汇报。具体事件操作流程参照《XXXX数据中心突发事件应急处理程序V2.1》执行。
(2)告知各业务部门停电相关信息,判断停电时间长短做好相应应急措施,提醒各部门做好数据备份以防万一。
(3)通知相关部门检查存在重大安全隐患的设备运行情况(譬如电梯,水房等),保障公司人员和财产安全。
(4)通知IT部门机房管理人员及机房设施相关人员进入紧急待命状态。
(5)恢复正常后,查明停电原因,记入机房安全管理日志。
5 4.培训和演习4.1 培训
IT运维部门及机房相关人员每年至少开展一次 机房停电等突发事件处理的培训,提高机房管理人员及其相关人员的应急能力。
4.2预案演习
各应急组织机构每年至少安排一次演练,通过演练发现应急工作体系和工作机制以及各备用设备,系统存在的问题,不断完善应急预案,提高应急处理能力。
5.附则 5.1预案更新
本预案结合演练和实施情况,及时进行修订和完善。
5.2责任与奖惩
各应急机构对在应急事件处置中作出突出贡献的集体和个人,提出表扬和奖励;对玩忽职守,造成不良影响或严重后果的,按有关规定提出处理意见,并追究其责任。
5.3制定和解释
本预案由IT 运维部门制定并解释。
5.4本预案实施或生效时间
本预案制定后提交部门讨论,审批通过后执行。
第5篇:机房突发停电应急预案
中心机房突发停电应急预案
为更好的应对机房停电此类突发事件,提高处理各类停电事件的能力,建立健全可靠的应急机制,最大限度地降低各类停电事件对院内各部门的影响,特制定大吴家卫生院机房停电事件应急预案(以下简称预案)。一:工作原则
(1)预防为主。立足安全防护,加强预警,重点保护公司重要系统信息,数据安全。(2)快速反应。发生突发事件时,及时获取充分而准确的信息,迅速处置,最大程度地减少突发事件影响。
(3)坚持“统一领导、协调配合、明确责任、坚守岗位”的原则。二:适用范围
所有机房临时停电,突发停电以及较长时间停电的事件。三:组织机构及职责
(1)组织机构(联系人名单及联系方式每半年更新一次)规划运营:主要联系人及联系方式(附联系人名单)(2)各组织机构职责
1).规划运营部门应尽可能及时通知所有部门停电信息,且准备好应急措施。
2).各部门应及时做好停电应急措施,通知各相关科室做好重要数据备份,并通知到机房管理人员,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;突发临时停电应尽可能做好远程技术支持工作。四:具体操作
第一条:机房意外停电后,首先确定停电的范围以及受影响的设备范围。
第二条:确认停电的范围为本机房或本院,应立即打后勤管理处电话汇报。估算电力可能恢复的时间,并通知网络中心领导。
第三条:如果确认停电的时间在1个小时内,可以在UPS正常供电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电,立即汇报给机房电源维护负责人和中心机房各设备的负责任到达现场。做好各设备的电源停电准备,在UPS供电达1.5个小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核心交换机和路由器。等待电力恢复,电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维护负责人。
第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向主管领导汇报。
第五条:将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。第六条:电力室恢复供电后,先不要急于给电源柜加电,等待10—20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。
第七条:供电正常后,确定设备处于下电状态后,打开电力柜的总控开。第八条:根据设备加电顺序,启动分项空开。
第九条:设备加电顺序,IP 交换机和SAN 交换机正常后再给存储加电,存储状态检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。
第十条:设备启动正常后,开始启动数据库。
第十二条:数据库启动正常后,开始启动中间件服务器。
第十一条:中间件服务器正常后,启动应用程序。
第6篇:数据机房停电事件应急预案
机房停电事件应急预案
1.各组织机构职责
1).医院动力科及时通知所有部门停电信息,且准备好应急措施,柴油发电机工作应提前检查柴油机性能,输出电压是否稳定以及柴油等辅助设备是否充足。
2).IT部门应及时做好停电应急措施,做好重要数据备份,并通知到机房设备供应商,同时做好拉闸限电的准备。为保障停电期间和恢复供电后机房所有设备正常运行,IT所有相关人员在此期间必须保持随时待命状态。
3).机房设备供应商应做好相关设备技术支持工作,若是计划内停电,应提前对机房设备做好停电应急方案,且在停电至恢复供电,所有设备恢复正常期间保持随时待命状态,重要关键设备,须有技术支持人员现场侯命;
2.应急预案
2.1机房长时间停电应急预案
⑴ 接到长时间停电通知后,应询问停电原因及具体停电时间,要求各部门尽可能在停电前停止业务、保存数据,关闭所有能关闭的用电设备。
⑵ 根据停电时间长短情况,协同规划运营部门部署应急措施,检查应急设备是否正常,若时间条件许可模拟停电测试应急设备性能。
1(3)对机房设备用电做好统计,做好拉闸限电预案。(4)检查机房UPS及其它设备是否运行正常,检查各系统是否运行正常,同时查询机房设备相关记录,计算UPS当前状况下可供电时间
(5)各相关技术支持人员部署到位,确保停电期间重要系统和设备运行正常,以及恢复供电后所有系统,设备运行正常。
(6)机房管理人员详细记录事件原因及此期间采取的应急措施,备案。
2.2 处理流程
1、检查配电系统,各低压配电柜及切换柜是否运行正常,切换开关检查。
2、检查各低压配电柜,查看当前运行参数(电流、电压)计算用电功率。
2、检查UPS系统运行参数是否正常,估算UPS可供电时间。 3、检查环控系统。
4、询问发电机启动后并机是否成功。
5、停电前停止业务、保存数据,关闭所有能关闭的用电设备。 6、停电前断开动力设备断路器。
7、发电机启动供电正常后,恢复相关设备。
8、时刻关注机房内温度,如温度升高应有处理措施,如物理散热或关闭部分设备。
9、时候关注机房环控系统,查看各项报警信息。
2 2.3 事后确认系统正常运行
1、供电恢复后依次开启动力设备断路器。
2检查各低压配电柜及UPS的工作状态,确认正常运行。3、检查精密空调是否正常开启,运行是否正常。4、检查电池间电池运行情况。5、检查机房内IT设备正常运行。6、检查环控系统,确认正常运行。
第7篇:网络中心机房停电应急预案
网络中心机房突发停电事故应急处理预案
第一条:机房意外停电后,首先确定停电的范围以及受影响的设备范围。
第二条:确认停电的范围为本楼或本校区,应立即打后勤管理处电话汇报。估算电力可能恢复的时间,并通知网络中心领导。
第三条:如果确认停电的时间在1个小时内,可以在UPS正常供电的时间内,等到电力恢复。如果不能确认在2个小时内恢复供电,立即汇报给机房电源维护负责人和中心机房各设备的负责任到达现场。做好各设备的电源停电准备,在UPS供电达1.5个小时后,严格按操作手册停掉存储和各应用服务器的电源,最后停核心交换机和路由期。等待电力恢复,电力恢复供电后转第七条执行。如果确认停电的范围仅在于本机房电源故障,立即汇报给机房电源维护负责人。
第四条:机房维护负责人将掉电的电源柜总空开和分空开的状态处于下电状态。并向主管领导汇报,马上联系相关厂家,如有可能请厂家立即到现场支持。
第五条:将掉电的所有的设备电源状态处于下电状态,以防止电源柜加电对设备的冲击。
第六条:等各厂家和相关的人员到齐后,商议设备恢复时因注意的事项,并形成相关文档。
第七条:电力室恢复供电后,先不要急于给电源柜加电,等待10—20 分钟后,再开始给电源柜加电,以防止供电不稳或再次掉电。
第八条:供电正常后,确定设备处于下电状态后,打开电力柜的总控开。第九条:根据设备加电顺序,启动分项空开。
第十条:设备加电顺序,IP 交换机和SAN 交换机正常后再给存储加电,存储状态检查正常后,启动主机(以上各设备务必按操作手册的启动顺序上电)。第十一条:设备启动正常后,开始启动数据库。第十二条:数据库启动正常后,开始启动中间件服务器。
第十三条:中间件服务器正常后,启动应用程序。
