有些人可能认为大数据分析是机器学习或人工智能的同义词,但其实这并不正确。虽然这些技术的某些方面可能被用于大数据的分析应用中,但只关注它们肯定会造成混淆和不切实际的期望。围绕人工智能的炒作,暗示当将其应用于大数据时,会自动生成有用的信息。它可以在最终用户很少或没有努力的情况下产生结果。然而,数据分析用户的体验往往却截然不同。
专注于创业公司的分析公司CB Insights认为,当前人工智能处于一种非理性的“繁荣”。人工智能技术的实际应用与营销炒作之间存在负相关性,这会对用户造成混淆。
例如,某供应商分享了一个案例研究,声称他们使用了以人工智能为中心的数据分析解决方案来解决生产问题。在演示文稿中,供应商展示了他们发现的生产过程和产品结果之间的相关性公式。该回归公式是一个很好的工具,但说它就等同于人工智能显然是种误导。公式使用的甚至不是回归变量;它是机器学习算法的一个最基本形式,也是在Microsoft Excel 2007数据分析工具包中就引入的一个功能。
一个有着10多年历史的功能,被重新包装和炒作为人工智能,表明在对认知计算的理解方面出现了混淆。这其中的一部分原因是人们缺乏对什么是人工智能、机器学习、深度学习和其它形式 "认知计算" 的理解,以及对监督和无监督变量的论据。
这种炒作与痛苦的现实形成了鲜明对比CONTROL ENGINEERING China版权所有,现实是很多企业收集到的大量数据甚至没有被分析或利用,从而无法提供有价值的信息,不能被工程师和分析人员用其来生成可执行的信息。
过程数据分析
虽然许多先进技术 (包括人工智能)可用于数据分析应用程序,但大数据分析的重点不应放在技术上。相反,重点应该放在用户体验上,以及如何将信息加速应用到过程优化中。
重点应该放在精通这一领域的专家(SME)——过程工程师、数据分析专家等,以及他们在数据中寻找信息的能力上。不管数据分析应用程序中使用的是什么技术,目标始终是让没有太多数据科学专业知识的用户能够访问和实施该解决方案。
设计良好的数据分析应用程序,应该使行业专家能够获取相应的信息。当数据分析应用程序挖掘其它功能时,应该在过程专家可以访问的易于使用的功能环境中实现这些创新。
数据分析应用程序应该使用可用的技术帮助最终用户获得成功。如果采用的是机器学习或人工智能,那很好,但数据分析应用程序不应仅限于这些功能,或其它为了市场炒作而限制其他功能。有许多算法和创新技术,都可以为想要挖掘数据洞察力的用户提供帮助。
算法功能可以包括为了进行数据清理的数字信号处理、过程信号中的形状检测以及分布式计算的Map-reduce模型。无论是调用机器学习、人工智能、还是其它算法,都不是重点。重点是帮助最终用户更快地获得成功。
数据连接
认知计算算法是过程制造和工业物联网(IIoT)解决方案中,进行数据分析的重要组成部分,但只是其中的一部分。其它方面还包括数据整理(这是必要的数据连接),清理和以及为了使用而进行的数据语境化。数据分析应用程序的重点,必须包括这些准备步骤,以便加快从数据连接到信息发布的速度。
此外,数据分析应用程序应使用户能够将分析扩展到所需的任何级别。最终用户将继续扩展使用数据分析应用程序以及对特定算法的需求。因此,数据分析应用程序应包括通过REST API、OData等特性对其它算法的可扩展性,并将算法集成到用户体验中。
侧重问题解决
当数据分析应用程序允许用户关注问题而不是技术时,用户可以将精力更集中于如何快速获得所需的结果。下文将从制药、电力、冶炼、石化和造纸行业中出现的实际问题中,解析大数据分析的应用。
● 制药实验室分析
问题: 当从实验室转向全面生产时,在实验室中实现的反应,不能在规模生产时重复。使用手动方法和现有的数据管理工具 (如电子表格),很难找到原因。
解决方案: 通过大数据分析,将汇集与实验室和全面生产相关的不同来源的数据进行分析。这使得制药企业能够快速比较这两个过程,并确定关键的区别,调整规模生产的参数以提高产量。
● 发电厂污染控制
问题: 工厂运行人员无法从工厂的自动化系统中快速获取足够的信息,实时控制污染减排设备。这经常会导致添加过量的化学药品,从而产生额外的成本。
解决方案: 数据分析应用程序处理信息的能力,可以快速地控制污染减排系统,就像控制其它任何过程变量一样,对化学物品如氮氧化物、硫磺氧化物的使用进行优化,减少汞的排放,在延长设备寿命的同时,降低化学药品的成本。
● 冶炼运营控制
问题: 像冶炼一样受到严格管制并且高能耗的生产工艺,很难用传统的电子表格来描述。因此,要平衡多个因素,并在成本、环境因素和能效之间做出最佳权衡几乎是不可能的。
解决方案: 数据分析被用于分析多个变量之间的关系,这使得在任何给定时间,基于关键变量来控制过程都变得更容易。通过尝试各种可能方案,简化了为不断变化的成本或新法规而进行的配比调整。
● 炼油反应床监控
问题:由于炼油厂的工况复杂,会造成各种问题,因此难以预测反应床的结垢。来自各传感器的数据往往带有噪音,因此就很难确定实际趋势并采取相应的纠正措施。
解决方案: 数据分析解决方案利用其数据清洗和胶囊技术,消除噪声,并确定导致加速结垢的关键运行工况。在稳态条件下创建基准,使您可以很容易地确定何时出现问题,并执行预测性维护。
● 纸浆和纸张质量评价
问题: 制浆机的制浆工艺可根据可用性混合各种木材品种。要想验证原料的变化会不会对最终产品产生负面影响是很困难的,这主要是因为从制浆到成品的时间很长。
解决方案: 数据分析应用以历史纸浆数据为基础,确定纸浆的最终产品质量。然后,在纸浆输送到造纸机之前,生产者开始测试纸浆,并利用这些信息,准确预测最终产品的关键特性。
使用正确的数据分析应用程序,将有助于制造企业实现效率提升的目标。当前的炒作和承诺,将会随着时间的推移而变得成熟,数据分析将成为工业环境中所期望的和稳定的必要组成部分。但是,具有行业专家和专业知识的最终用户将会领先一程。
集成人工智能、机器学习和其它技术,将使数据分析应用程序能够从大数据中更快的生成可执行的信息。
有效数据分析的4个要求
要实现IIoT的好处,需要重新审视软件分析产品。目标是找到一个产品,可以提供完整和灵活的方法,从生产数据中提取有价值的信息。数据分析软件CONTROL ENGINEERING China版权所有,可以给过程专家提供第一手的有价值的数据信息CONTROL ENGINEERING China版权所有,使他们能够自定义分析并改进生产结果。
能为IIoT的实施提供有价值的数据分析需要注意以下4个方面:
1. 生产率提升
这需要一种应用方法,以便工程师和分析人员可以很容易地使用该软件,作为他们调查和发现工作的一部分,以快速改善生产。分析工具必须适合具有专业知识以及对工厂了解的人员使用,而不是那些软件领域方面的专家但不了解该工艺过程的人员,如程序员、数据专家。
2. 时间序列数据
任何IIoT实施的核心CONTROL ENGINEERING China版权所有,都是来自传感器的模拟数据。这些数据通常难以操作、清理和情景化。典型的手动解决方案需要在Excel表中或编程脚本中花费数小时来自定义。IIoT的数据分析工具,应促进和加速对时间序列数据的调查,以便工程师能够专注于发现和洞察而不是数据的处理或操作。
3. 数据种类和语境
这允许传感器数据由与其关联的批处理或资产来组织管理,也可以很容易地被分解为连续过程中的机器状态和条件。这一点很重要,因为最典型的工况是新旧数据混合在一起,或者混合了来自不同来源的控制数据。
4. 协作支助
这使得团队成员之间以及一个或多个设施之间的共享发现和讨论成为可能。 这需要能从任何平台(包括PC、平板电脑和智能手机)上运行的任何浏览器访问数据分析软件。 因此,为了从采集的数据中获得最大收益CONTROL ENGINEERING China版权所有,过程制造企业应该寻找了解数据背景以及企业面临的业务和过程挑战的系统供应商。这些供应商可以在集成协议、部署和体系结构方面进行大量的提升,使过程工厂能够集中精力,从各种IIoT方案中获得最大的价值。(作者:Michael Risse)