NEC于2015年8月18日宣布,开发出了在大数据预测分析中实施事前数据处理的新技术。该技术可对有助于预测的特征数据、即“特征量”自动实施提取及评价处理,因此被命名为“特征量自动设计技术”。
该技术在利用NEC开发的“异种混合学习技术(用于发现大数据中混合的大量规律性)”实施分析之前使用。以前,特征量的提取处理是由经验丰富的分析技术人员实施的。例如CONTROL ENGINEERING China版权所有,在预测啤酒的销售额时www.cechina.cn,大家都知道当气温超过特定数值时销售额会受到很大影响。数据分析技术人员从销售额与气温数据中发现了关联性,通过对影响销售额的特定气温数据(特征量)实施提取及评价,计算出高精度的分析及预测结果。
此次的技术可使分析技术人员实施的一系列处理实现自动化。使用该技术进行的验证实验表明,从事前数据处理到利用“异种混合学习技术”实施分析及预测,整体时间可缩短到原来的约1/3。这样一来,便可为需要实施大量数据分析的零售店迅速、实时地提供各商品种类的预测分析。NEC预定在2015年度内使此次的新技术投入实际使用。
NEC介绍称,此次的“特征量自动设计技术”主要有两大特点:(1)开发出了可高速搜寻数据变换组合的“高速搜寻算法”。该算法可针对待分析的大量数据CONTROL ENGINEERING China版权所有,从“数据变换处理”的庞大组合中,高速搜寻出最佳组合。这样便可自动提取出有效的特征量。
(2)将数据分析技术人员的经验制作成了类库。在特征量提取方面CONTROL ENGINEERING China版权所有,将“标准化”、“移动平均”(时序数据的平均化)等数据分析人员以前通过大量的经验培育的多种“数据变化处理”制成了类库。通过组合这些类库www.cechina.cn,便可轻松提取出多种特征量。