图片来源:Maverick Technologies
报警管理不当会造成产能降低,导致工业设施计划外停机,进而造成数百万美元的损失, 甚至可能会引发重大的工业安全事故。如果在设施故障期间同时面临数十个报警,运行人员几乎不可能快速区分重要报警和不重要报警,这会延缓响应时间,也就无法在问题升级之前缓解问题。
通常情况下,“报警泛滥”源于设计不当的报警系统, 例如,优先级设置不当控制工程网版权所有,报警点设置不当,报警无效www.cechina.cn, 人机界面 (HMI) 上的图形和警报定义模糊或混乱。如果高效报警管理系统与工厂自动化系统整体集成,那么存在上述报警问题的工厂,可以从中受益匪浅。
许多自动化供应商已经开发了一些工具来帮助解决报警问题,并减少运行人员必须响应的报警数量和频率。然而,减少数量只能解决部分问题。
最终目标是将运行人员的注意力引导到与问题相关的最关键信息上。这需要一种更智能的设计,能够在合适的时间向合适的运行人员发送正确的报警,配以适当的重要性、背景信息和指导,以便运行人员能够纠正或快速缓解工况。
报警的最佳实践和理念
ANSI/ISA-18.2-2016“过程工业中的报警系统管理”, 侧重于基于分布式控制系统(DCS)、监控和数据采集(SCADA)系统或可编程逻辑控制器(PLC)平台所采用的现代过程自动化解决方案中的报警。虽然它通常应用于连续过程工业,但也可应用于其它制造过程,如批处理、离散和混合,因此其具有普遍的适用性。
该标准为管理报警系统的生命周期,提供了指导原则和明确定义的流程。它以整体生命周期的形式,阐明了报警原理和合理化流程,首先是只有在流程和安全方面需要创建报警的时候才创建它们。它还为选择和实施报警设定了更高的标准。
该标准强调了最佳实践,重点是为当前情况定义合适的报警数量,而不是给出总数量的最小或最大值。相反,重点放在报警频率上。在一个过程中,偏离正常的方式多种多样,如果有太多未有效管理的报警时, 就会出问题。发生这种情况时,运行人员可能会不知所措,很难将真正重要的报警与重复或不相关的报警区分开来。结果是态势感知受到影响,运行人员最终会做出糟糕的操作决策,甚至可能使问题进一步升级。
与许多ISA 标准一样,ANSI/ISA-18.2 是一种被认可的良好工程实践,因此许多安全监管机构要求制造商在运行中遵守这些要求。该标准应用的一个基础方面是创建报警原理文档,以定义对报警的严重性、紧迫性和响应的评级标准。简单来说,报警原理是一套关于如何有效管理报警的指南,并为正常运行的报警管理系统提供基础。有了它,设施可以标准化、设计、开发、实施、修改、管理、维护和持续改进其报警。也可以据此开发报警响应流程,并与HMI 集成,以帮助运行人员有效响应,缓解异常工况。
报警原理标准确定后,报警合理化过程有助于将维持高效运行和安全所需的报警数量降至最低。报警合理化团队根据报警原理标准审查、证明、验证和记录每个报警。合理化的主要目标是评估报警,确定根本原因,并确定运行人员需要哪些报警,并应将其包含在有用警报池中。
关键报警:帮助运行人员快速理解
为了进一步说明该过程CONTROL ENGINEERING China版权所有,让我们以压缩机转速下降并同时影响多个过程的工况为例。该事件可能会导致人机界面亮起,出现大量报警。在这种工况下,运行人员真正需要知道什么?压缩机坏了,这是关键报警。无数其它报警模糊了这一现实。停机原因可能与温度、压力、电气跳闸或其它因素有关——所有这些都是与根本原因相关的宝贵信息。
事件的关键性和影响一旦确定,就可以进行集中分析, 以将潜在的相关报警分为根本原因、触发事件以及引发事件的所有其它条件和事件。每种类型的报警都应区别对待。因果报警的配置方式,应确保运行人员得到足够的早期警告,以便及时做出反应,防止发生严重事件。如果事件确实发生CONTROL ENGINEERING China版权所有,应抑制产生的报警,以免影响运行人员的态势感知。
合理化报警:将信息与行动分开
上述评估是控制运行人员在发生关键事件时可能遇到的报警数量良好的第一步,但检查每个报警以确保其满足基本要求也非常重要。报警合理化过程,是剔除不符合这一要求的所谓“报警”的关键,这些报警应被归入一组单独的纯信息事件。该过程还有助于确定运行人员必要的响应时间,以及未能及时采取行动的后果。
在上面的压缩机场景中,一些符合条件的问题应该是:“运行人员是否必须对报警采取行动?”如果回答为“是”,则合理化过程应确定:在出现后果(如压力下降或压缩机完全停止)之前,运行人员在多长时间之内必须采取行动。确定未能采取行动的严重性也同样重要CONTROL ENGINEERING China版权所有,因为这有助于区分关键报警。这就突出了意外停机、人员安全或环境破坏的可能性。
由于必须考虑的报警数量之多,合理化工作是一项重要的工作,但这项努力物有所值。该过程强调了一个重要的事实,即许多“报警”根本不是报警,它们并不总是有用或必要的。关键是在最需要的时候提供报警,并在不需要的时候予以抑制。
抑制报警:动态和静态抑制
如前所述,在不需要时抑制报警,是管理大量潜在报警的一个关键方面。事实上,在很多时候,这是将报警频率降低到可控水平的最佳方法。为此,ANSI/ ISA-18.2 定义了以下三种报警抑制形式:
搁置:运行人员手动临时抑制报警。
设计:过程自动化系统根据一组特定的条件抑制报警。
停止使用:由于部分设备因维护或其它原因停机, 报警被抑制。
在这三者当中,最有趣和最具挑战性的是设计抑制, 它进一步分为两类——动态和静态。动态抑制是这两者中最具挑战性的,因为它需要创建系统用于确定报警重要性的规则。它为自动化系统提供了足够的智能来确定最重要的警报,以确保它们被通知,并抑制不必要和不相关的报警。正是这种智能有助于避免在不安和其他复杂情况下出现报警泛滥。
静态抑制基于工艺和设备的状态。在规定的程序或条件下启用或抑制特定报警。例如,某些报警可能仅在机组启动期间启用。在这两种抑制类型中,静态抑制技术更简单、更常用。
合格的人员: 对定义和处理进行培训
如上所述,关键报警应被识别和记录,并在报警理念文件中定义其处理方法。一个报警管理计划包含了这些文件,以及一个适当的合理化的报警系统,使运行人员能够识别根本原因并解决问题。这个过程将是漫长而乏味的,对于一个大型工厂来说,合理化团队可能每天要从超过10,000 个或更多的警报中处理超过100 个警报。出于这个原因,管理层的认识和支持是必要的,以确保这一过程的完成。
此外,还需要对内部人员进行培训,以正确制定报警列表,并设计、部署和维护报警列表,因为很少有公司有足够合格的人员,具备执行这项工作所需要的技能和经验深度。在这种情况下,可以咨询经验丰富的第三方合作伙伴,来创建和维护报警管理计划,并利用丰富经验的专家,为其实施提供指导和帮助。考虑到对人员的潜在安全风险和生产减产所造成的潜在巨大成本,采用上述基于标准的报警管理计划,虽然需要大量资源,这种努力是非常值得的。(作者 | Richard Slaugenhaupt)
关键概念:
■ 报警管理不当, 会导致生产损失, 并可能引发重大工业事故。
■ 用户需要简化报警系统, 并确定哪些报警需要立即响应,哪些不需要。
思考一下:
您是如何管理报警并使这个过程更有效率的?