大数据时代,数据已经渗透到各个行业和业务职能领域,成为重要的生产因素。但对于企业而言,只有数据是远远不够的,企业还需要学会从海量的数据(Data)中提取有用的信息(Information),随后转变为能为己用的知识(Knowledge),最终做出智慧(Wisdom)的决策。
数据分析的流程
面对旺盛且复杂的数据分析需求www.cechina.cn,企业可以借助 PPDAC 闭环体系对数据进行高效的分析。
● 首先,PPDAC闭环寻找出企业生产中存在的痛点问题(Problem)
● 随后针对痛点问题制定生产数据计划(Plan)
● 紧接着采集、整理与痛点问题相关的数据(Data)
● 之后对这些数据进行相关层次的分析(Analysis)
● 最后根据分析结果得出结论(Conclusion)
这些结论能为企业提供有效解决痛点问题的解决方案。
在数据分析过程中,根据程度的不同,可分为四个分析阶段:描述性分析、诊断性分析、
预测性分析和规范性分析。这四个阶段的难度与分析所获得的价值都是逐次递增的,并且每个阶段采用的技术手段也不尽相同。本文重点介绍描述性分析与预测性分析的过程。
获取数据
首先,企业要明确生产过程中的痛点问题,制定相应的计划,而后再进行相关数据的采集工作。数据存在于工业企业的各个层级之中,拥有各种表现形式。例如,通过 CIP、Profibus 等各种通讯协议在总线中流动的实时数据;存储在文件、数据库、历史数据库等软件中的历史数据;通过 MQTT, HTTP 等协议传输的物联网信息;还有通过 REST API 从云端传来的信息等。
不同层级的信息特点各不相同:越往底层,通讯频率越快,节点越多,对时效性的要求越高;越往高层,通讯信息量越大,对时效性要求则相对低一些。
为了从大范围的场景获取所有的数据,数据获取软件需要具备以下强大功能:
● 支持众多协议,包括传统的封闭工业协议到互联网流行的 REST API 协议
● 高效率的通讯,能够过滤采样,减少重复信息
● 高性能的通讯,能够支持众多节点,以及较大的通讯量
● 高安全性的通讯,能够支持权限、认证管理、加密传输以应对越发猖獗的网络攻击
● 高可靠性的通讯,能够应对各种网络波动及故障的考验
● 完成相关的数据采集后,需要对数据进行整理、清洗、加工等,以备下一步分析
描述性分析
在获取足够的数据之后,企业就可进入不同层级的数据分析阶段,其中以描述性分析为基础。描述性分析旨在了解数据“已经发生了什么”,主要是通过计算数据的基本统计特征值,例如,最大值、最小值、方差、标准差、中位数、频数等,来了解已有数据的集中趋势、分布情况及离散程度等信息。
此外,描述性分析作为企业最常用的数据分析手段,能够快速指出要查找的内容,预先定义计算模式,而后通过现在或者历史数据进行计算,最后可用报表或仪表盘视图将分析结果呈现出来,大大节省数据分析时间。下方展示的设备综合效率(OEE)就是如此。
预测性分析
正如前文提到,描述性分析主要对数据的过去进行总结,而预测性分析则需了解“将来会发生什么”。它将历史数据与统计建模、数据挖掘技术和机器学习相结合,找出数据之间存在的关系,并基于数据对未来的设备情况通过建立模型进行预测。这样能够帮助管理人员预测将来可能会发生的情况,进而提前计划及决策CONTROL ENGINEERING China版权所有,而非被动地只能针对已经发生的事件作出回应。
在预测性分析中,企业需要运用机器学习算法进行建模预测,其中算法的种类多样,常用的基本算法包括决策树、线性回归、K 均值、朴素贝叶斯等,此外还有诸如神经网络之类的高级算法。想要彻底地理解这些算法并不容易,需要丰富的数学、概率论等交叉学科的知识。好在目前研究成熟,我们只需模块化地使用即可。
以监督学习为例,利用机器学习进行预测性分析时,其使用流程与工业传统的PID算法流程大致相同,具体步骤如下:
● 第一步,选择数据
从历史数据中找出相关数据,并且标识出其中的特征值与输出
● 第二步,选择模型
依据待处理的问题选择合适的回归或分类算法
● 第三步,调试优化
使用80%的数据对模型进行训练,随后利用剩下20%的数据对模型进行测试,观察预测的准确率是否达到预期。如果准确率不够,则调整相关参数,再次进行测试
● 第四步,部署
将考核通过的模型部署到系统中,接收新的数据,输出预测结果
在数据分析后,数据可视化成为企业快速解决痛点问题的关键所在。用于数据可视化的图形多种多样(如下图所示),只要选择合适的图形来展示合适的数据就可以起到事半功倍的效果。例如:用饼状图展示不同数据的占比情况;用散点图展示数据的分布情况及相关性(Correlation),再用曲线拟合,做一些简单的预测;用表格展示汇总信息;用气泡图展示三个变量之间的关系等,在工业行业中,由于诸多数据是时间序列数据(Time series data),因此选用折线图(Line chart)进行展示,便能够高效地了解数据的趋势(Trend)。总而言之,对于不同的数据,选择最佳的展现方式能够让数据可视化发挥出最优效果。
但是,仅仅从一个视角对数据进行观察是远远不够的,为了能够更加全面地了解数据情况,我们需要将多个视角产生的图表整合在同一个数据展板上。同时,对数据进行不同层次的展示也是必不可少的,数据钻取就能很好地完成这项任务www.cechina.cn,它能够针对不同层级、结构或条件对数据进行细分呈现,让用户得以缩小数据范围www.cechina.cn,逐步下钻并聚焦到小点上,为用户节省更多时间与精力,同时优化数据可视性的效果。
罗克韦尔自动化 FactoryTalk Analytics 为工业制造从业人员提供了从描述性分析到规范性分析的完整解决方案控制工程网版权所有,能够改善整体设备效率 (OEE) 、减少停机时间,以及改善质量或流程。
FactoryTalk Analytics 具体功能如下:
● 可以使用 FactoryTalk Edge Gateway 从工业企业的各个环节将数据引入
● 可以借助 FactoryTalk Analytics DataView 和 FactoryTalk Metrics 对数据进行描述性分析、整体设备效率 (OEE) 及可视化展示
● 可以依靠 FactoryTalk Analytics LogixAI、FactoryTalk Analytics Edge ML 、Pavilion8 在企业的不同层面对数据进行预测性分析
FactoryTalk Analytics 现可为流程工程师、数据科学家等提供全面且简洁的数据分析技术,使数据分析准备工作量减少70% 。FactoryTalk Analytics 还可与 InnovationSuite 增强现实和制造执行系统 (
MES) 解决方案无缝集成,将切实可行的见解带至车间,优化企业级供应链运作。
小罗有话说
大数据之于企业而言,既是机遇,也是挑战。罗克韦尔自动化凭借先进的自动化、数字化和智能化技术,为客户提供以数据分析为主线的全方位数字解决方案,帮助企业解决数据分析、可视化等难题,让数据会“说话”,进一步为企业节省决策时间,赢得独特竞争优势,逐步实现从节流、开源到颠覆的价值突破。