2016年机器学习有三大趋势。其中,Gartner分析认为,算法将形成一个全球性的交易市场,就像当年的App经济,催生出全新一代的专业技术初创企业,并且革新机器与机器之间的交互方式;算法是创造智能应用的基石。同时,更多的数据将生成更好的模型和用户体验,进而吸引更多的用户以及更多的数据,而这将导致储存和计算数据的成本持续降低。
上个月,在被视为美国人工智能发展另一片新天地的西雅图,Madrona风险投资集团举办了一场机器学习与人工智能峰会。100多个专家、研究者和记者汇聚一堂,讨论人工智能的未来、机器学习的趋势,以及如何设计更智能的应用程序。
算法公司Algorithmia的MattKiser参加本次峰会后总结,如今,每家公司都成了数据公司,能够在云中使用机器学习来大规模地部署智能应用,这得益于机器学习的三大发展趋势。
“每个成功的新应用程序都将是智能应用,”Madrona风险投资集团的投资合伙人Somasegar说。“智能模块和学习功能将成为应用的大脑。”Somasegar曾是微软副总裁www.cechina.cn,负责软件开发者部门,2015年离职,加入Madrona。
下面就来看看,机器学习的这三大趋势将如何让应用变得更智能。
算法将形成经济
Gartner副总裁兼研究员PeterSondergaard说,“从根本上来说,数据是不会说话的,真正的价值在算法,算法决定行动”。
Gartner副总裁:算法才是真正价值所在
如果你不去利用数据,世界上的数据就不会有用。算法其实指的是如何在业务过程中有效拓展人为管理,利用数据。
“世界上所有大规模的东西都将被数据和算法所管理,”微软机器学习和数据集团全球副总裁JosephSirosh说。在不远的未来,“所有业务都将成为算法业务”。
而这,将催生出“算法经济”:算法交易将会形成一个全球性的市场,世界各地的研究人员、工程师都能在这个市场上创造、分享乃至合成大规模的新算法。届时,算法也将变得像集装箱一样,能够任意组和扩展,从而搭建适用于不同应用的架构。
也就是说,多个机器学习算法可以结合起来成为更强大的算法,从而更好地分析数据,充分发掘数据里的价值。
在算法经济中,前沿的技术项目,无论是先进的智能助理,还是能够自动计算库存的无人机,最终都将落实成为实实在在的代码,供人使用和交易。
上图的智能应用列表揭示了智能应用的抽象层级:从最下一层起,先是数据基础设置,接下来是数据收集和准备,再来是建造模块和服务,第4层是交互界面,最后才是消费者直接用到的服务。而要实现上图中的智能应用,无论是那一层,都离不开算法。
算法是创造智能应用的基石。
至于数据——国际人工智能学会Fellow、香港科技大学冠名讲座教授杨强就试图用迁移学习让计算机摆脱对大数据的严重依赖,从而让人工智能不再只是“富人的游戏”。也就是说,如果算法足够强大,大数据并非必须。
“算法市场类似于App商店,后者创造了所谓的App经济。”Gartner的研究总监AlexanderLinden说。“App经济的本质是,让各种各样的个人能够在全球范围内发行和销售软件,而不需要用自己的想法去说服投资人或建立自己的销售、市场和分发渠道。”
Gartner曾发表报告,对算法经济可能带来的市场影响做出评估。Gartner认为,算法经济将无可避免地创造一个全新的市场,人们可以对各种算法进行买卖,为当下的公司汇聚大量的额外收入,并催生出全新一代的专业技术初创企业。
想象这样一个市场:数十亿的算法都是可以买卖的,每一个算法代表的是一种软件代码,能解决一个或多个技术难题CONTROL ENGINEERING China版权所有,或者从物联网的指数级增长中创造一个新的机会。
正如App变革了人类与机器的交互方式一样,我们将会看到,算法经济将会促进下一代机器对机器互动演进的巨大飞跃。
人们将会通过产品使用的算法来评价它的性能好坏。企业的竞争力也不仅仅在于大数据,还要有能够把数据转换为实际应用的算法。因此,CEO应该关注公司有产权的算法,而不仅仅是大数据。
其中,最好的例证莫过于MobileyeCONTROL ENGINEERING China版权所有,这家市值已经超过百亿的以色列算法公司在2014年8月IPO时,首日涨幅接近50%。此前的智驾深谈中,新智元也提到过,截至2015年底,Mobileye在全球有超过1000万装机量,覆盖超过20家车企的273款车型。集成度极高的解决方案,快速的市场推进速度,无一不让所有人觉得眼前一亮,这些成功的背后,都是因为其多年积累的强大算法在支撑。
Mobileye为特斯拉提供的自动驾驶系统是全球首个实际上路的DNN。
5月,被英特尔收购的初创公司Itseez,其核心技术是一套名叫“驾驶员高级助理系统”的视觉算法,能让汽车硬件识别出行人和交通标志,探测汽车何时偏离车道,并对可能发生的碰撞提出警报。这类技术目前已应用于高端汽车;将来当自动驾驶汽车实际上路时,该技术或将变得更加重要。
差不多在同一时间,ARM以3.5亿美元收购了英国计算视觉公司Apical。Apical是全球领先的图像和嵌入式计算视觉公司,拥有多项计算视觉IP模块。不仅如此,现在全球有超过15亿台智能手机和3亿台网络摄像机、数码静态相机和平板使用Apical的图像产品。像这样既有数据又有算法的公司,ARM以3.5亿美元收购用以巩固计算视觉和图像处理技术壁垒,也就不令人意外了。
MagicPony的算法看了左边的图片后,自动生成右边的图片。
还有刚刚过去的热潮,Twitter据称用1.5亿美元收购只有十几个员工的英国初创公司MagicPony。根据英国专利局网页,这家机器学习算法公司在图像和视频处理方面拥有15项专利(MagicPony官网称拥有超过20项)。其中,最有名的算法能够利用图像中原本没有的信息,提高图像的分辨率,这些新的数据是算法从以前看过的、与待处理图像类似的大量图像中生成的,这个算法的工作原理跟人眼类似。
数据飞轮效应
数据和云存储遵从摩尔定律:每过两年,世界上的数据量就会翻倍,同时用于存储这些数据的成本则会以同样的速度下降。这些大量的数据使得人们可以创造出更多的产品特征和更好的机器学习模型。
Somasegar用“数据飞轮效应”来形容这个情形:在智能应用的世界里,数据为王,而那些能够产生出最高质量数据的服务将获得压倒性的优势——更多的数据生成更好的模型、更好的用户体验,进而吸引更多的用户以及更多的数据。换句话说,也就是形成一个闭环和正反馈。
例如,Tesla收集了7.8亿英里的驾驶数据,每过10小时里程数就会递增100万英里。
这些数据被喂给了Telsa的辅助驾驶程序Autopilot,它使用超声传感器、雷达和摄像机以在不与人互动的情况下进行驾驶和改变车道和避免碰撞。最终,这些数据将成为他们计划在2018年发布的自动驾驶汽车的基础。
谷歌的自动驾驶项目只积累了150万英里的驾驶数据。与之相比,Telsa的数据飞轮效应更加强劲有力。
云端人工智能
一家公司要想发现其业务中的洞见,使用算法机器智能从其数据中进行迭代学习是唯一可扩展的方式。要知道,这一直以来都成本高昂,也不一定有产出。
Sirosh说,今天的数据科学就像40年前的裁缝一样费时费力。
例如,一家公司需要首先收集定制数据,雇佣一个数据科学家团队,持续地开发并优化模型,以跟上快速改变和增长的数据的步伐——而这只是工作的开始。
现在,当拥有更多的数据,而存储数据的成本也下降之后,机器学习开始向云端迁移;在云上,可扩展的网络服务是可以随叫随用的API。数据科学家不再需要管理基础设施或实现自定义代码。系统将为他们实现这些功能,实时产生新的模型,并提供更快、更准确的结果。
数据显示,谷歌从2012年到2015年,使用深度学习技术的软件数量每年都在急剧增长,2012年只有100个左右,到了2015年第四季度前,已经有近2700个。
“当用来建造和部署机器学习模型的成本大大变小,当你可以‘批量生产’它时,我们就可以从云端广泛地获取机器学习所需的数据了。”
正在涌现的机器智能平台可以以“模型作为服务”的方式,托管预训练过的机器学习模型www.cechina.cn,从而令企业能够更容易地开启机器学习,快速将其应用从原型转化成产品。
“当企业们采用了微服务(microservice)发展范式后,接入并使用不同的机器学习模型和服务以提供特定功能的能力将变得越来越有价值”,Somasegar说。
当诸如Scikit-Learn,NLTK,Numpy,Caffe,TensorFlow,Theano,orTorch等开源机器学习和深度学习框架在云端运行时,企业将能够方便地利用预训练过的托管模型来标记图片、推荐产品和进行一般的自然语言处理任务。
机器学习趋势总结
“我们的世界观是,每家企业现在都是一家数据企业,而每个应用都是智能应用,”Somasegar说,“企业怎样才能从海量数据中获得洞见,并从中学习?这是世界上的每家公司都需要了解的。”
当数据飞轮开始运转,用来获取、储存和计算数据的成本将持续下降。
这创造出了算法经济控制工程网版权所有,其中的机器智能基石将在云端实现。这些预训练的、托管的机器学习模型将使每家App都能够大规模利用算法智能。