随着人们对大数据分析在实现企业目标方面作用的关注,如何为运营技术(OT)自动化和控制应用来处理数据,正变得越来越重要。数据设计、数据架构和数据采集会深刻地影响数据分析,或者用一句老话来说就是:垃圾进www.cechina.cn,垃圾出。学习数据收集和分析的最佳实践,以便将数据转化为超出其原始用途的信息和价值,对企业来说是很有必要的。
考虑如下场景:假设两个旅行者正在旅行。第一个人说,“我们迷路了。”第二个人回答说:“我们没有迷路,我知道我们在哪里,我只是不知道如何到达目的地。”第二种表述突出了到达目的地所需要的三项信息。目的地、当前位置以及到达目的地的路径。
要想解决一个问题,需要用户先确定问题、收集数据然后找到解决方案,以创建路线图。图片来源:Martin CSI
数据收集和分析是相似的。很容易“上手”并开始收集数据。但是在这么做之前,请务必先想清楚以下3个方面:
1.目的地:要解决什么问题?
2.位置:有哪些数据可用于解决问题?
3.路径:拥有的数据如何帮助找到解决方案?
数据分析目标:识别和提出问题
数据分析的第一步是识别问题,然后提出问题。例如,制造公司生产的产品,在材料强度方面差异很大,而导致质量差(问题)。
该公司怀疑是制造过程中压力或温度的变化而造成的问题。接下来,以疑问句的形式重新阐述这个问题,然后用数据来回答。例如,在这种场景下,我们可以问:“压力或温度的变化是否会影响产品的强度?”
位置:收集回答问题所需的数据
下一步是决定需要哪些数据来回答问题。可将可用数据认为是当前位置。从表面上看,需要收集的数据似乎很明显:压力和温度。但是CONTROL ENGINEERING China版权所有,要获得完整的信息,还必须查看数据收集的地点、时间和方式。
例如,用户可能有一个测量过程罐温度的传感器。然而,传感器可能安装在罐的顶部,它并不能准确测量反应发生时的温度。因此,用户可能需要添加第二个传感器来更直接地测量反应温度。
用户还需要某种形式的相关数据,使他们能够将每个质量测量与相应的过程测量相关联。在此示例中,用户将记录与过程数据(温度和压力)和质量数据(材料强度)相关的通用批号。他们还需要生成一个新的批号,并在流程的所有步骤中跟踪该批号。
数据分析路径:理解数据与问题之间的关系
分析和跟踪数据可以将用户引导到目的地,以回答原始问题。有许多路径可供选择。其中包括从回归和分类算法到神经网络和监督学习等各种分析方法。但是CONTROL ENGINEERING China版权所有,用户在开始路径之前需要很好地理解数据和问题之间的关系。他们可能想知道压力和温度的变化是如何影响材料强度,进而影响产品质量的。选择一个模型,插入数据并寻找结果可能很有诱惑力。但对过程有一个很好的理解将获得更好的结果。
如果用户知道温度过热超过2度CONTROL ENGINEERING China版权所有,会使产品强度变差,那么他们就可以选择一个模型,来帮助在数据中寻找线索。此外,如果知道超温需要1个小时才能影响质量,则有助于选择一个合适的分辨率和采样率。这可能需要做出一些假设,假设越合理,回答问题就越容易。
表:提出问题可以帮助用户确定他们是否需要本地服务器、云服务器、边缘设备或数据集中器。
数据分析系统架构的常用组件
解决和回答完所有问题后控制工程网版权所有,用户就有了到达目的地的路线图,就可以开始数据收集。数据分析系统架构是到达目的地的交通工具。有一些常用的组件用于构建这个架构:
边缘设备:提供本地网络(数据源)和公网设备之间的接口。它们可用于缓冲和格式化数据并执行计算。一些边缘设备可以选择配置防火墙、提供蜂窝访问和充当协议转换器。
数据集中器:该设备通常是可编程逻辑控制器(PLC),用于从现有传感器和PLC收集和汇总数据。在上传到服务器计算机之前,它可充当缓冲数据、进行数据格式化和计算。
本地服务器:托管在本地的服务器PC。它通常用于提供监控、报告和数据仓库。
云服务器:服务器PC,托管在云中并可通过因特网访问。它可用于提供仪表板、报告、通知、数据仓库和高级分析。
从数据采集到解决方案的路径,有时就像一条漫长而曲折的道路。然而,花费在识别问题、提出问题和收集高质量数据上的额外努力,将有助于减少弯路。数据分析系统架构建立在一组通用部件之上,是通向目的地的交通工具。所以,当目标、解决方案和工具都清晰了控制工程网版权所有,您就可以轻松踏上这趟数字化之旅了。(作者:Joe Martin)