力控科技

管控一体化解决之道

DCS报警的统一管理和系统优化

1         DCS系统报警管理现状

1.1          异构DCS系统的报警管理难题

目前中国很多流程工业企业已经大量使用DCS系统提高生产的自动化,但是因为在初期规划中缺少经验等历史原因,DCS系统的品牌、型号等往往比较混乱,没有形成统一规划,造成大量异构的DCS系统。DCS系统均具备报警模块,但不同品牌DCS的报警模块并不具备互相通信的功能,报警模型也各不相同,统一管理成为异构DCS系统的一个大难题。同一个企业,报警系统形成多个孤立的区块,分散成多个信息孤岛,人机界面无法统一,也无法对报警信息进行更深一步的挖掘和应用,只能应用于最基层的现场,对管理层形成了信息上的屏蔽,带来很大的管理不便。

1.2          报警数量激增带来事故风险

DCS系统的应用,使报警的设置非常方便,非常廉价,但方便和廉价也带来了相应的问题——报警设置的随意性。在很多企业,当前的问题不再是报警不足,而是报警过量和报警不当,而大量和低效的报警给企业生产带来了巨大的潜在风险,不仅会降低生产利润,更有可能造成生命和财产的巨大损失。

1994年,英国Milford港的Texaco炼油厂发生爆炸起火事故,在发生爆炸前的11分钟内,系统产生了275个报警,而这275个报警仅仅有两个处理人员进行处理,而两个工作人员根本无法在众多的报警当中辨识出真正有意义的信息,结果导致了悲剧的产生。

DCS报警设置数量不合理、优先级配置不当、参数配置不当、无法识别和阻止报警洪水等问题,是当前DCS系统报警普遍存在的问题。



图表  SEQ 图表 \* ARABIC 1 报警数量过大造成潜在的事故危险

1.3          对报警原始信息深加工的需求

虽然大部分DCS系统具备报警功能,但是这些功能往往针对现场控制所设计,功能比较原始。报警历史信息在经过长时间沉淀之后,实际上可以有更多的利用价值,经过统计分析和大数据挖掘,可以提供诸如发现设备故障隐患、预防潜在的生产事故、提高生产效率和对生产人员进行KPI管理等更多的管理方面的应用功能,为管理层提供生产决策的辅助信息,而这些往往是现有的DCS系统所不具备的。

2         异构DCS报警的统一管理

解决异构DCS报警统一管理的首要问题,是能够对系统中存在的报警信息进行统一采集。力控科技的FAlarm工业智能报警管理平台对此提供了解决的方案。大部分DCS系统提供OPC A&E Server,力控FAlarm能够通过OPC标准协议采集DCS设备的报警信息;而对于不能提供OPC A&EDCS,力控则提供多种标准通信协议,甚至根据DCSAPI进行接口定制,以满足各类DCS报警的采集需求。

解决异构DCS报警统一管理的第二个问题,是对系统中报警信息的模型统一。力控FAlarm在系统内部建立了统一的报警模型,对于异构的DCS报警信息进行解析,将报警模型统一化,以方便后续的各类处理。

解决异构DCS报警统一管理的第三个问题是人机界面的统一。力控FAlarm提供了基于Web浏览器的人机界面系统,可以将所有DCS系统的报警信息统一进行可视化,提供实时报警、历史报警、报警维护、报警统计分析等可视化内容,提供各种报表图表的可视化手段,并可以与现场的工艺流程画面结合显示,或者与GIS(地理信息系统)进行集成显示。



图表  SEQ 图表 \* ARABIC 2 统一的报警管理人机界面

图表  SEQ 图表 \* ARABIC 3 统一的报警管理人机界面

3         降低DCS系统报警造成的事故隐患

为了减少工业报警不当造成的风险并提供工业报警管理的最佳实践,国际组件ASM1992年成立,其建立的初衷就是推进DCS报警系统的改进,并在2009年推出正式的工业告警管理国际标准——ISA-18.2ANSI/ISA–18.2–2009 Management of Alarm Systemsfor the Process Industries)。

该标准的内容涵盖了报警管理的整个生命周期,而其核心正是报警系统本身的KPI,即如何对报警进行正确的持续的改进,从而减少无效和低效报警,减少报警洪水,从而降低发生生产事故的风险。



图表  SEQ 图表 \* ARABIC 4 国际标准ISA-18.2涵盖了报警管理的整个生命周期

 

指标

目标值

单位时间报警数量

最优值

最大值

每天每个操作人员处理报警数量

150个报警

300个报警

平均每小时每个操作人员处理报警数量

6个报警

12个报警

平均每10分钟每个操作人员处理报警数量

1个报警

2个报警

指标

目标值

一个小时超过30个报警的时间比例

<1%

10分钟超过10个报警的时间比例

<1%

10分钟为周期,报警最大数量

10

处于报警洪水状态的时间占总时间比例

<1%

10个高频报警点

<1%~5%

ChatteringFleeting报警的数量

0

陈旧报警

每天均小于5%

报警优先级分布

3级:低80%,中15%,高5%

4级:低80%,中15%,高5%,最高<1%

未授权的报警抑制

0

未授权的报警参数修改

0

图表  SEQ 图表 \* ARABIC 5 报警系统KPI

 

力控FAlarm系统是严格按照ISA-18.2所设计的,为企业提供了大量的报警分析工具,以降低无效报警数量,优化报警系统KPI

(1)       报警数量统计和分析:通过数量和优先级的统计,分析报警数量和报警处理人员配比是否合理,分析报警优先级分布是否合理。

(2)       报警洪水定位和分析:通过报警洪水统计功能,定位报警洪水的数量和相关测点,分析洪水产生的原因,从而可以通过解除报警洪水诱因,减少报警洪水数量。

(3)       反复报警和瞬时报警的定位和分析:通过反复报警和瞬时报警统计功能,定位测点分析原因,通过解除报警诱因以减少反复报警和瞬时报警的数量。

(4)       顽固报警定位和分析:定位顽固报警的测点并分析其原因,减少顽固报警的数量。

(5)       报警维护功能:通过报警维护功能,可以将某些测点的报警挂起一段时间(在指定时间段内不再产生报警),例如在设备进行维护或者更换的时候,如果不挂起报警,可能产生大量无效报警,这种情况下采用报警维护功能,可以减少不必要的报警信息。

(6)       多工况报警功能:多工况报警可以令报警在不同的工况下采用不同的报警属性,从而提高报警信息的有效性,降低无效报警产生的几率。

(7)       报警KPI分析:FAlarm提供的报警KPI指标采用了ISA-18.2标准,通过统计系统KPI并和标准指标进行对比,为进一步优化报警系统提供决策数据。

 

4         报警数据挖掘

DCS系统所提供的原始报警信息虽然可以解决现场的很多问题,但是其利用价值并没有被充分的挖掘出来,在大数据技术越来越成熟的今天,对海量历史报警信息进行数据挖掘并为生产提供辅助决策信息成为可能。

力控FAlarm平台就提供了大量统计分析和数据挖掘的工具,配合行业中的生产模型和设备模型,可以完成设备故障预警、异常停机预警、生产事故预警、设备老化分析、人员KPI统计等。