批处理分析在联机操作上的成功应用,催生了一种可用于特殊化学品批处理过程的方案。
这篇文章阐述了批处理分析操作的基本原理,包括通过Web界面进行访问等。
—Rober Wojewodka,The Lubrizol公司
—Terry Blevins, Willy Wojsznis,Emerson Process Management公司
过程分析技术(PAT),广义地说,是一种包括化学、物理、微生物、统计及风险在内的综合分析方式,并广泛应用于批量生产中。其中,多元统计建模(数据分析),是专为批处理过程分析而研发的一种极好的工具。在线分析技术包含了故障检测及批末质量预测。这种方法能带来显著的经济效益;但是,其实现过程中还面临多种挑战,因而目前还很少有在线应用的记录。
要成功地进行在线批处理分析,须解决下列关键问题:
• 过程停滞:由操作者及事故引起的过程中止及重启。有时CONTROL ENGINEERING China版权所有,中止和重启是批处理过程的一个设计环节,例如需要加入特殊要素时。其他时候,由于需要等待公用设备就位等原因的限制,批处理的进度可能会延迟。在开发分析模块时或在线分析的应用中,必须将停滞数据纳入考虑范围。
图1 批处理数据的特性
•获取实验室数据:由于批处理的特性,要对质量参数进行在线测量,可能在技术上并不可行,或者在经济成本上不能允许。因此,通常在批处理中进行多点取样并放在实验室中进行分析。为了进行在线分析,必须将实验室的分析结果用于模型的开发及验证。
•原料变化:批处理的原料,可能由上游工序定期进行重新装填的存贮罐来提供CONTROL ENGINEERING China版权所有,或由外部供应商通过卡车或铁路运送。输入原料的特性若发生变化,会对批处理操作及质量参数产生直接影响,这些变化应能通过在线分析工具进行分析。
•操作条件变化:对于不同的批处理操作,加工条件可能有很大的不同。批处理过程应按相似的操作执行条件而划分为多个操作阶段,对每一操作阶段都应建立一个分析模型。
•并发批处理:同一产品的多个批处理可能分为多个完成阶段。
•数据的集合和组织:通常,由于一些限制因素,在进行批处理过程的详细分析时会产生困难,例如无法进行访问、无法获取正确的序列及组织一个包含所有必须数据的数据集。要实现过程分析并将分析结果进行在线传递,这些要求必须得到满足。
•不同批处理的数据排列:不同批处理的持续时间是不同的。进行分析模型的开发时,需对多个批处理的数据进行排列,对于每一批次,都需形成具有同等数量数据样本的数据。
为了解决在批处理中遇到的挑战控制工程网版权所有,一个行之有效的方法是,将最新的发展和研究应用到批处理建模、过程控制系统及网络技术之中,并在分析系统开发商和用户密切合作的基础上,制定出实施战略。
分析原理
在上个世纪初即已出现的多元统计法,可有效地帮助分析的建立。个人电脑促成了这些方法的各种实际应用,尤其是应用于批处理分析中。人们开发了几种配套技术,主要用于在进行批处理分析时的数据展开及数据排列。批处理分析技术的概要介绍如下。
数据排列
受过程停滞或加工条件的影响,完成一项或多项与批处理相关的操作所需的时间可能会有所变化。(见图1)不过,在模型开发时使用的批处理数据,必须以某种方式进行排列之后,才可用于数据分析。
图2 动态时间规整的应用
为了统一批处理的长度,批处理中某个特定时间的数据,可以按某种方式进行简单的移除、压缩或扩展,以获取相同数量的时间增量。若采用一种叫做动态时间规整(DTW)的新技术,则能取得更好的结果。DTW利用参考轨迹,通过最小化它们之间的总间距来排列数据。DTW将持续时间为平均值的批处理作为初始参考。图2示出了如何利用DTW原理来排列轨迹。为了满足轨迹之间距离为最小,红色轨迹(A)上的两个或多个点可转化为绿色轨迹上的某一点,或某一点可扩展为绿色轨迹上的多个点(B)。
图3 动态数据展开及PCA建模矩阵
数据展开
模型的数据文件经过排列后,形成了一个三维数组:I 批处理,J 变量以及K 扫描周期(见图3)。模型开发之前,首先要将数据文件展开为二维,IKxJ。相对于通常使用的基于批次的展开及基于变量的展开,新近出现的混合展开是一种更好的方法。采用混合展开CONTROL ENGINEERING China版权所有,能计算出基于批次展开的数据在每一时间段内的平均值及方差。(见图3,箭头A。)然后,这些数据按基于变量展开进行重新排列(见图3,箭头B);因此,混合展开不同于原先的基于批次展开,它不再需要假定从目前时间直到阶段结束的任意轨迹。
图4 故障检测的基本概念
多元统计法
对于相互关联的过程,需要使用多元统计技术。图4显示,虽然两个相关参数的趋势轨迹在其各自的过程控制限值内,过程操作在确定观察中仍被视为故障(即,参数之间的关系被打破),这种故障只能使用多元统计来检测。
使用较多的一种主要的多元分析法是主成分分析(PCA)。PCA技术的核心概念,是基于时间的一条测量值的曲线,此曲线利用多项批处理来进行确定,这些批处理生产的产品应质量优良且未出现过异常加工故障。该模型可有助于理解多元参数是如何彼此相关联,以及所有因素是如何影响每批的成本。
设计模型的结构时,需考虑到批处理操作中所用的许多测量方法是彼此关联的,并对过程输入变化具有相似的响应。换句话说,它们是共线的。在这样的条件下,所有的过程变量都可用初级主要成分来进行建模。(图3的矩阵T。)PCA模型可用于辨识可能对产品质量造成影响的过程及测量故障。
图5 用PCA描述参与建模的变量及未建模的变量
过程变量中参与建模的部分同样也使用HotelingT2统计来描述。不属于主要成分的非关联变量则不进行建模。它们被视为Q统计量。通过这种方法,所有的过程变量都可通过两个指示器进行显示(见图5)。图5下端的两个条形图显示了特定过程参数是如何贡献到过程变量中的。为了诊断选定的参数,操作者可以将绘制的参数趋势图线与参考趋势图线以及可接受的参数变化带进行对比参照。
使用这两种统计方法,便能及早确定批处理中的故障条件,便于进行调查和修正,以消除故障带来的影响。
潜在结构推算(PLS,又称偏最小二乘),是一种用于分析加工条件对最终产品质量的影响,并能向操作者持续提供批末质量参数预测的方法。在一些批处理过程中,当需要对操作结果按离散类别进行分类时(例如,故障类别,级别,等等),可在使用PCA及PLS的同时结合使用另一种称为判别分析(PLS-DA)的多元统计法。
文章编号:1109-03
发送短信“ 文章编号+ 评语代码”
13910666165,告诉我们您对此文的意见。
1- 很好控制工程网版权所有,有很高的参考价值
2- 一般,有一定的参考价值
3- 不好,没有参考价值