企业必须控制大数据,以确保其工业AI系统能够在正确的时间提供正确的见解。
工业企业拥有大量数据——可能比他们实际需要的要多——但他们的人工智能努力仍然往往远未达到预期。为了取得成功,他们需要确保他们输入到工业AI系统中的数据经过充分审查和适当。
这是麦肯锡最近一份报告的呼吁,该报告提出了控制大数据的建议,以确保他们的人工智能系统在正确的时间提供正确的见解。
“重工业领域的许多公司花了数年时间构建和存储大数据,但尚未释放其全部价值CONTROL ENGINEERING China版权所有,”由Jay Agarwal领导的麦肯锡分析师团队报道。
麦肯锡估计,超过75%的工业企业已经试行了某种形式的人工智能,但只有不到15%的公司实现了有意义的、可扩展的影响。这是因为对于被引导到这些人工智能系统的数据没有足够的运营洞察力或监督。
工厂AI成功的关键是可靠的历史数据的可用性CONTROL ENGINEERING China版权所有,或者被称之为“智能数据”。这些数据需要“将他们的大数据调整成一种适合人工智能的形式,通常具有更少的变量,并且具有智能的,基于第一原理的特征工程”。
他们估计,通过重新设计智能数据,并引入适当的培训,企业可以将回报提高5%至15%。
麦肯锡团队建议采取以下6个步骤来确保数据与工业AI系统之间的契合:
界定过程。 与专家和工厂工程师一起概述工艺步骤,勾勒出物理变化(如研磨和加热)和化学变化(如氧化和聚合)。识别关键传感器和仪器,以及它们的维护日期、限制、测量单位以及它们是否可以被控制。
丰富数据。原始过程数据几乎总是包含缺陷。因此,创建高质量的数据集应该是重点,而不是争取最大数量的可观察量进行训练。团队应积极删除非稳态信息,例如设备的升和降,以及来自不相关工厂配置或操作制度的数据。
降低维度。AI算法通过将输出(称为可观察量)与一组输入(称为特征)匹配来构建模型,这些输入由原始传感器数据或其派生组成。当与现代工厂中可用的大量传感器相结合时,这就会产生大量的观测数据。
团队应该削减特征列表CONTROL ENGINEERING China版权所有,仅包括那些描述物理过程的输入www.cechina.cn,然后应用确定性方程来创建智能组合传感器信息的特征,例如结合质量和流量以产生密度。
将机器学习集中在手头的流程上。总体而言,重点应放在创建推动工厂改进的模型上www.cechina.cn,而不是调整模型以实现最高的预测准确性。团队应该记住,过程数据自然会表现出高度的相关性。
在某些情况下,模型性能可能看起来非常出色,但隔离因果成分和可控变量比仅依靠相关性更重要。
实施和验证模型。 团队应通过检查重要特征,与专家一起不断审查模型结果,以确保它们与物理过程相匹配。
组件一个高效团队。 没有足够的过程专家,以发起和验证将填充AI系统的适当数据,这是一个亟待解决的领域。在重工业中部署人工智能需要由操作员、数据科学家、自动化工程师和流程专家组成的跨职能团队。
我们经常发现企业希望在数据科学方面有所部署,但他们往往面临着关于过程专家的三个主要挑战:
· 在特定设施或整个企业缺乏过程专业知识;
· 有足够的过程专家,但他们对现代数字化或分析工具感到不适应;
· 或者过程专家不知道如何在数字化团队中有效地工作。