被外界誉为“中国版ChatGPT”终于来了。
李彦宏:文心一言确实不完美,发布是因为有市场需求。
3月16日,百度在北京召开新闻发布会,宣布“文心一言”正式发布。
百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
发布会上,百度公布了“文心一言”的邀请测试方案。3月16日起,首批用户即可通过邀请测试码,在“文心一言”官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放“文心一言”API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入“文心一言”云服务测试。
然而,市场给出的反应并不如预期。百度盘中股价跌幅一度扩大超10%,报120.1港元,截至发稿,跌幅收窄至7.34%,报123.8港元。
李彦宏:对标ChatGPT门槛很高,百度是全球大厂第一个
据李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。
“全球大厂中百度是第一个发布的”,李彦宏坦承CONTROL ENGINEERING China版权所有,这段时间不断有人问他为什么现在发布“文心一言”,百度是否真的准备好了,“从我自己在内测过程中体验到的“文心一言”的能力来说,当前确实不能叫作‘完美’”。李彦宏表示,发布是因为有市场需求——百度的各个产品线都在等待这样的技术,客户也在等待,因而需要尽早推出。
人类进入人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层到“芯片-框架-模型-应用”四层。李彦宏认为,百度AI全栈布局的优势在于,可以在技术栈的四层架构中实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。
李彦宏预测,大语言模型将带来三大产业机会。第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。“文心一言”将根本性地改变云计算行业的游戏规则。“文心一言”将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,对于大部分创业者和企业来说,真正的机会是基于通用大语言模型抢先开发重要的应用服务,这可能才是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。
“文心一言”与GPT-4同台竞技
值得注意的是,在百度正式发布“文心一言”的前一天,因为ChatGPT爆火的OpenAI再次发布新模型——GPT-4。
与此前的版本相比,GPT-4具备强大的识图能力,文字输入限制也提升至2.5万字;GPT-4的回答准确性也显著提升,还能够生成歌词、创意文本从而实现风格变化。同时,GPT-4在各类专业测试及学术基准上也表现优良。
“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍,“GPT-4是一个大型多模态模型,它接受图像和文本输入、进行文本输出,虽然在许多现实场景中它尚且不如人类,但在各种专业和学术基准上表现出与人类相当的性能。”
OpenAI新模型的发布,又一次次点燃了再次点燃整个科技圈的想象力。“见证历史了。”看到GPT4的发布后,有多位业内人士感叹道。
而原本定在第二天发布、被业内称为“中国版ChatGPT”的百度“文心一言”,毫无疑问就这样站在了与GPT-4同台竞技的舞台上。
据百度宣布,目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的650家企业宣布加入百度“文心一言”生态。
虽然不至于肩负“全村唯一的希望”,但市场普遍认为,“文心一言”之于2023年的百度,或将成为一个期盼已久的拐点。
“文心一言”实力如何?
从现场展示来看,“文心一言”某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。
在文学创作场景中,“文心一言”根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,“文心一言”准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,“文心一言”也基于推理能力得出了正确答案。
连续三次内容创作生成中,“文心一言”既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的“智能涌现”。“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
“文心一言”还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,“文心一言”能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
多模态生成方面,李彦宏现场展示了“文心一言”生成文本、、音频和视频的能力。“文心一言”甚至能够生成四川话等方言语音;“文心一言”的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
据王海峰介绍,新一代知识增强大语言模型“文心一言”,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中已经有应用和积累,在“文心一言”中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新www.cechina.cn,也是“文心一言”未来越来越强大的基础。
在知识增强方面,“文心一言”的知识增强主要是通过知识内化和知识外用两种方式。知识内化,是从大规模知识和无标注数据中,基于语义单元学习,利用知识构造训练数据,将知识学习到模型参数中;知识外用,是引入外部多源异构知识,做知识推理、提示构建等等。
在检索增强方面,“文心一言”的检索增强,来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。
在对话增强方面,基于对话技术和应用积累,“文心一言”具备记忆机制、上下文理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
“百度特有的技术,现在已经应用在文心一言上”,王海峰也坦言,技术有了,但是大模型的训练的还不够充分。不过文心大模型建立起人类反馈、奖励模型和策略优化之间的飞轮机制,随着真实用户的反馈越来越多,“文心一言”的效果会越来越好,能力越来越强。
那些年,百度错过的风口
百度作为中国最大的搜索引擎和互联网公司之一,自2000年成立以来经历了许多机遇和挑战,也取得了巨大的成就。但是从2010年开始,百度由于各种各样的原因和失误CONTROL ENGINEERING China版权所有,错失许多风口。
从财报上来看,2010-2015年,百度主要的战略主要是:拓展视频业务和深化垂直搜索布局。
2010年百度成立奇艺网(爱奇艺前身),2012年,百度控制了爱奇艺的控股权,并在2013年收购PPStream,与爱奇艺合并。
2011年,百度取得了去哪儿网的控制权,目的是通过搜索+旅游领域的结合为有旅游需求的用户提供更精准的信息。
2011年,百度投资安居客,目标是占领地产类搜索的高地。
值得注意的是,2011年百度有啊(电子商务平台)与百度说吧关闭,标志着百度退出了电商与社交网络的业务试水。
在此阶段,百度的业务中心仍在是深挖本身的优势—搜索,继续巩固自身通用搜索的地位,同时融合垂直领域搜索与通用搜索的结合。百度此阶段的成功主要还是搜索业务的红利期还在,以及谷歌退出给百度带来的当仁不让的地位。
2013年,百度出资19亿美元收购91无线已发行的全部股本,这笔收购被看作是百度在试图努力追上移动互联网的步伐。然而,很多观点认为,91无线的估值是偏高的。
因为当时各个手机厂家都开始集合自己的应用市场,厂商们集中在这一阶段进行互联网化,以小米为代表的先驱已经开始创造自己的应用商店平台。而像腾讯这样的巨头,靠着QQ等社交巨无霸研发出的应用宝顺着4G和Wifi时代一骑绝尘。因此,91无线并没有看上去那么高(19亿美金)的价值。
2015年,百度正式意识到移动互联网业务的重要性,这一年百度对集团组织结构进行了调整,2015年2月2日,李彦宏群发邮件,决定“将重心转向移动互联网,扩大百度在移动入口的优势。”而这距离2011年腾讯推出微信已过去了四年。
由于没有及时跟上移动互联网的趋势进行早期商业布局,百度后续针对移动互联网的布局都略显被动。此后,无论是各种APP争夺用户和打车软件烧钱PK、还是百团大战,亦或电商疯狂补贴,这些超级APP的发展故事中鲜少出现百度的身影。
这一次,百度能飞上AI风口吗?
在互联网巨头和后起之秀的前后夹击下,错失互联网风口的百度选择了全面进军AI,成为了全国第一个提出“ALL in AI”的科技公司。
自2010年开始,百度开始布局和构建AI技术体系。2013年-2014年,百度成立了百度美国研究院、百度深度学习研究院两大研究院,以及大数据实验室、硅谷人工智能实验室两个实验室;2017年7月首次发布人工智能开放平台的整体战略、技术和解决方案,正式宣布All In AI。
投入至今控制工程网版权所有,百度在AI技术架构的芯片层、框架层、模型层和应用层都做了全栈布局。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,百度在各个层面都有关键自研技术CONTROL ENGINEERING China版权所有,这在国内堪称独树一帜。
其中,模型层是近年来IT技术栈全新增加的分类,背后蕴藏着一场人工智能落地模式的变革。百度是构建大模型的先驱之一,根据IDC发布的《2022中国大模型发展白皮书》指出,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力全面领先,受到行业广泛认可。
在应用层面,百度搜索、百度智能云、百度无人驾驶汽车等业务均处在业界领先位置,将是“文心一言”落地应用的最佳土壤。
在研发层面,百度是中国研发投入强度最高的科技企业之一。据最新发布的百度2022财年业绩报告,全年实现营收1236.75亿元,净利润(非美国通用会计准则)206.8亿元,同比增长10%;核心收入连续四个季度业绩超市场预期。财报显示,2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。
目前,百度已经形成了以AI为核心,以智能云、智能驾驶、AI服务平台飞桨、百度大脑、智能音箱小度、元宇宙希壤、数字人希加加、度晓晓的全景生态。
与此同时,百度对AI的投入也是巨大的。过去10年,百度在AI的潜伏期坚持投入,研发总额超过千亿元,因而打造了强大的AI技术护城河。国家知识产权局知识产权发展研究中心发布的《中国民营企业发明专利授权量报告(2021)》也显示,百度位居Top10,其中AI专利授权连续5年获得第一。
自ChatGPT走红后,“文心一言”站上了百度发展的C位。在百度的设想中,“文心一言”将与现有业务深度融合,带来新的商业可能。李彦宏在电话会议上表示,百度计划将多项主流业务与“文心一言”整合。一是与搜索整合;二是通过百度智能云对外提供服务;三是将“文心一言”大模型搭载到Apollo智舱系列产品;四是与小度进行集成。
但百度能否凭借“文心一言”打个翻身仗,目前看来仍然未可知。