随着人工智能成为大国竞争的新焦点。与美国相比,我国目前人工智能的短板就是关键根技术的缺失。
“十四五”时期人工智能规划需要关注的重点就是如何通过明确我国人工智能技术发展路线,发挥我国制度优势,促进人工智能根技术突破和创新。
AlphaGo再次进化。
2020年12月,据《自然》杂志报道,DeepMind公司的一项研究提出了MuZero算法,可以在不知道规则的情况下,通过自己试验,掌握围棋、国际象棋等游戏,被认为在寻求通用人工智能算法方面迈出重要一步。
许多人还记得,2016年,这个人工智能程序的“前辈”AlphaGo第一次战胜人类世界顶级围棋选手。一年后,继任者AlphaGoZero通过规则输入和自我博弈进行学习,在仅40天的训练后成功击败上一代产品。不久之后,9小时掌握国际象棋、12小时掌握日本将棋、13天掌握围棋的AlphaZero出世……
是什么让人工智能飞速进化?
如果把人工智能比作一棵“技术树”,击败人类棋手的人工智能程序只是“树冠”,为整棵树提供滋养、使其不断升级的,则是围绕基础软硬件的人工智能根技术。
中国科学技术信息研究所党委书记赵志耘告诉《了望》新闻周刊记者,人工智能根技术,是指那些能够支撑人工智能技术发展和支撑人工智能产业衍生的基础研究和关键技术,比如人工智能芯片、系统框架等。
根深叶茂。某种程度上,根技术,决定着产业发展的兴衰。
根技术左右人工智能生态
人工智能对计算能力的需求有多强?
据硅谷非营利组织OpenAI测算,2012年开始,全球人工智能训练所用的计算量呈现指数增长,平均每3.43个月便会翻一倍,目前计算量已扩大30万倍,远超算力增长速度。传统的CPU架构早已无法满足深度学习对算力的需求,AlphaGo的硬件基础就是专注神经网络算法、大幅加快运算速度的TPU芯片。
可以说,作为算力的关键基础,人工智能芯片的性能决定着人工智能产业的发展。
清华大学微纳电子系教授魏少军指出,现有CPU、GPU、FPGA等芯片的基本架构早在这次人工智能突破之前就已经存在了,并不是为人工智能而专门设计的,因此不能完美地承担实现人工智能的任务。人工智能对芯片的要求,除了足够的算力和极高的能效比,还需要一个高能效、通用的计算引擎。
魏少军认为人工智能芯片至少应有以下几个特质:第一,可编程性,要适应算法的演进和应对多样性,因为算法不稳定,在不断变化;第二,架构动态可变性,要适应不同算法;第三,高效的架构变换能力,因为不同的运算要求变换不同的架构。
除此之外,AlphaGo之所以能在极短时间内快速“进化”,算法的提升同样功不可没,背后是人工智能算法框架使然。
赛迪智库信息化与软件产业研究所信息技术研究室负责人许亚倩说,算法框架能够极大地提高人工智能学习效率。一方面,算法框架降低了深度学习的难度,提供进行深度学习的底层架构、接口,以及大量训练好的神经网络模型,减少用户的编程耗时。另一方面www.cechina.cn,大部分深度学习框架具有良好的可扩展性,支持将复杂的计算任务优化后在多个服务器的CPU、GPU或TPU中并行运行,缩短模型的训练时间。
此外,许亚倩认为,算法框架还是人工智能核心生态圈建立的关键环节。算法框架是决定人工智能技术、产业、应用的核心环节,是人工智能核心生态圈建立的基础和关键。算法框架的研发能够促进生态圈关联及外围的芯片、系统、软硬件平台等产业发展,从而促进人工智能核心生态圈的建设。
欧美发达国家已经在人工智能算法框架方面进行了大量的研究和开发应用。Google、亚马逊、微软、IBM等国际科技巨头纷纷布局算法框架,抢占技术和市场先机,开发开源了TensorFlow、PyTorch等一批主流人工智能算法框架。
根技术是关键短板
“随着中美竞争态势加剧,人工智能成为大国竞争的新焦点。与美国相比,我国目前人工智能的短板就是关键根技术的缺失。”赵志耘说。
受访专家指出,近年来,我国人工智能在技术与应用方面取得了巨大进展,在国际上具备了一定的竞争力,但基础层整体实力较弱,缺乏人工智能框架、人工智能芯片等根技术的支撑——芯片大多依赖进口,计算力方面的基础薄弱,且开源框架受制于国外巨头。
据了解,我国芯片进口额已经连续多年超过石油,2019年超过3000亿美元;操作系统、高端光刻机仍被国外公司垄断,90%以上传感器来自国外。
赛迪智库人工智能产业形势分析课题组研究指出,在人工智能的算力支持方面,IBM、HPE、戴尔等国际巨头稳居全球服务器市场前三位,浪潮、联想、新华三等国内企业市场份额有限;国内人工智能芯片厂商需要大量依靠高通、英伟达、AMD、赛灵思、美满电子、EMC、安华高、联发科等国际巨头供货,中科寒武纪等国内企业发展刚刚起步。
用清华大学电子工程系教授汪玉的话概括,大致上国内人工智能芯片在需要聪明智慧的环节做得不错,但在需要积累沉淀的环节做得却不够好。专家指出,我国人工智能芯片在通用化、产业链完整度、高速接口和专用的集成电路IP核等方面都存在短板。
“对于人工智能芯片产业来说,仅有好的硬基础是不够的,在硬基础上再做出好的软件,才能做得更好。”中国信息通信研究院云计算与大数据研究所总工程师王蕴韬强调说。
目前,我国在基础软件方面仍面临外国厂商独大的局面。数据显示,中国服务器发货量占全球28%,中国的操作系统销售额则占全球不足6%。从全球市场份额来看,中国应用软件基本达成了“三分天下有其一”的格局。但从技术底座来看,只有约10%的政府类应用软件运行在中国的技术底座上,其余九成的应用还是以国外技术底座为主。
了望智库联合莫干山研究院发布的《赋能数字经济拥抱算力时代》报告则指出www.cechina.cn,我国新计算产业底层技术架构和标准由国外企业主导,存在较高产业安全风险。自第一代电子管计算机ENIAC面世以来,CPU外围所有的接口总线标准制定权,都掌握在国外企业手中,我国企业只能在既定框架内谋求发展。
以人工智能框架这样的基础软件为例,深度学习主流框架TensorFlow、Caffe等均为美国企业或机构掌握,国内还缺少自主可控的全场景计算框架,且目前计算框架存在开发门槛高、运行成本高、部署难度大等亟待解决的问题。
《赋能数字经济拥抱算力时代》报告指出,目前西方国家以超30%的投入主导全球关键开源社区和开源项目。GitHub(一个面向开源及私有软件项目的托管平台)2019年年度报告显示,在其4000万的用户(开发人员)中,美国开发人员占30%,其他国家的开发人员占到70%;年度最受欢迎的Top10开源软件和项目,均由谷歌、微软、Facebook等美国公司主导。虽然2020年,来自美国的开源贡献者下降到22.7%,越来越多的开发者来自中国(9.76%)和印度(5.2%),但总体来看,我国在开源社区和项目的贡献度仍然不高,影响力有待进一步提高。
超前布局突破根技术制约
赵志耘认为,“十四五”时期人工智能规划需要关注的重点是如何通过明确我国人工智能技术发展路线,发挥我国制度优势,促进人工智能根技术突破和创新。
人工智能芯片方面,专家表示,首先需要全面布局,在政府层面加强对通用芯片支持力度。在技术路径上,遵循全面布局,分步突破原则,近期重点突破以NPU为代表的ASIC芯片,远期突破GPU、FPGA等通用芯片;在应用环节上逐步拓展,从边缘端逐步扩展到云端,从推理芯片拓展到训练芯片;同时探索多种芯片高效协同运行的芯片解决方案。由于ASIC芯片专用性强www.cechina.cn,不同厂商往往需根据应用场景需求自主研发;而GPU、FPGA等通用芯片由于有标准化产品,国内终端应用厂商自主研发或国产化替代意愿不强。因此,政府层面应在GPU和FPGA等通用芯片领域加强布局推广力度。
此外,加强类脑芯片等前沿性领域布局。充分发挥国内高校以及科研院所力量,布局类脑芯片等前沿性领域。该领域国际巨头尚未形成技术及知识产权壁垒,提前布局将使我国在人工智能芯片领域存在换道超车的可能性。
赛迪顾问股份有限公司的研究认为,人工智能芯片未来将呈现新发展趋势。如芯片开发将从技术难点转向场景痛点。目前,人工智能芯片设计更多地是从技术角度出发,以满足特定性能需求。未来,芯片设计需要从应用场景出发,借助场景落地实现规模发展。又如,技术路线将从专用芯片转向通用芯片。目前应用于人工智能领域的芯片多为特定场景设计,不能灵活适应多场景需求,未来需要专门为人工智能设计灵活、通用的芯片。另外,现阶段人工智能芯片产业的发展方式大多以企业为主体,产品上下游企业的运营和管理相对独立,但同环节的企业却高度竞争,未来产业发展应以合作为主线,形成产业生态。
北京大学经济学院教授、深圳市湾区数字经济与科技研究院院长曹和平表示,发展人工智能芯片要有产业思维。“要做产业,而不仅仅是做产品。要在促进芯片产业发展的前提下做芯片,在全景产业链条下做芯片的外部性成本更低。”
中国工程院院士高文认为,开源是软件时代非常关键的一条技术路线,人工智能领域也应该采用。
中国工程院院士倪光南表示,芯片设计门槛极高,只有极少数企业能够承受中高端芯片研发成本控制工程网版权所有,这也制约了芯片领域创新。我国可以借鉴开源软件成功经验,降低创新门槛,提高企业自主能力,发展国产开源芯片。
人工智能框架方面,专家指出,新一代人工智能开源计算框架,首先要让人工智能专家、工程师、数据科学家们可以更好地使用;其次,计算框架需要满足人工智能全场景的应用需求,更好地保护数据隐私;并且可开源,通过开源形成广泛的应用生态,广泛支持不同类型的人工智能芯片、硬件设备、应用等。目前,深度学习框架开源已成趋势。旷视深度学习框架天元、华为深度学习框架MindSpore皆已正式开源。
赵志耘还建议,应通过集约化建设人工智能基础设施和计算中心等,进一步利用长板,加快人工智能与行业深度融合,培养多层次人才CONTROL ENGINEERING China版权所有,确保我国人工智能产业在中长期国际竞争中持续保持领先。
目前,新基建正带动一批人工智能基础设施落地。2020年以来,河南、安徽、广州等地均有数据中心项目启动。去年,总投资超150亿元的腾讯长三角人工智能超算中心及产业基地落户上海松江区,武汉人工智能计算中心也启动建设。赵志耘认为,人工智能计算中心是人工智能产业的基础算力供给平台,能极大发挥集聚效应,承担人工智能领域的国家重大战略需求、基础共性技术攻关、前瞻性基础与算法研究,并能带动当地优势产业领域的人工智能核心技术研发及应用,促进高端人才培养。