李彦宏:文心一言对标 ChatGPT?门槛很高!
IT 技术的技术栈正在发生根本性变化。
来源|多知网
作者 |冯玮
图片来源 | 百度
今天下午,百度就新一代大语言模型生成式 AI 产品 " 文心一言 " 召开发布会。
百度创始人、董事长兼首席执行官李彦宏介绍了当前文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
其中的一些能力也同样可适配到教育场景中。
例如,发布会现场,面对 " 鸡兔同笼 " 的经典题型,文心一言能梳理出解题思路,并按正确步骤一步步算出答案;文心一言在现场还解释了成语 " 洛阳纸贵 " 的含义、" 洛阳纸贵 " 对应的经济学理论,并用 " 洛阳纸贵 " 四个字创作了一首藏头诗。
此前,作业帮、高途、学大、昂立、达内、宝宝巴士、艺术宝等教育领域品牌均宣布已接入文心一言。
宝宝巴士官方曾表示:接入文心一言后,宝宝巴士将基于百度智能对话技术成果,研发面向儿童启蒙的内容产品与服务,并应用于宝宝巴士旗下 200 余款 APP、2500 多集视频及 9000 多期音频启蒙内容、点读笔及绘本等产品中……
李彦宏在现场罕见出现了紧张状态,同时坦言目前的文心一言尚不算完美。
" 但为什么今天要发布?因为有市场需求,因为百度的各个产品线从搜索到智能云到自动驾驶到小度,大家都在等着要用这样的技术。更重要的是我们的客户、我们的合作伙伴在等着用这样的技术。" 李彦宏说道。
3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。同时期,百度智能云即将面向企业客户开放文心一言 API 接口调用服务预约。
以下为李彦宏分享全文,经多知网编辑整理。
01
百度真的 Ready 了么?
尊敬的各位来宾,各位媒体界的朋友们,欢迎大家来到百度参加我们这次文心一言的新闻发布会,感谢大家一直以来对我们的关注和支持。
这段时间其实不断的有人问我说为什么现在发布?你们是不是真的 ready 了?
其实百度在过去的十几年当中,一直从 AI 研发层面坚持投入文心大模型。
第一个版本是 2019 年就发布了,那么此后的每一年其实都要发布一个新的版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力的一个自然延续。
今天大家对文心一言的期望值是要对标 Chat GPT,那这个门槛还是很高的,可以说全球的大厂当中百度是第一个发布的,像 Google、Facebook、Amazon 等现在都没有真正的发布同类型的同级别的产品,百度是第一个。
从我自己在内测对文心一言的能力体验来说,它确实也不能讲叫做完美。但为什么今天要发布?因为有市场需求,因为百度的各个产品线从搜索到智能云到自动驾驶到小度,大家都在等着要用这样的技术,更重要的是我们的客户、我们的合作伙伴在等着用这样的技术。
大家都在催,我们需要尽早地把它发布出来。
当然,一旦大语言模型这种产品发布出来,它就会获得真正的、真实的用户反馈;而有了用户反馈,它的迭代的速度就会非常快,能力提升也会非常快。
我们大家都希望文心一言能够快一点成长,能够尽早给用户和客户带来价值,让所有的人都从中受益。
所以 " 十月怀胎,一朝分娩 ",今天我就带大家一起来看一看,百度的预训练生成式大语言模型,文心一言长什么样?
我下面用 5 个 Demo 来分别展示一下文心一言的能力。
02
五个模块,五种能力
第一个是文学创作,第二个是商业文案的创作,第三个是数理逻辑的推算,第四个是中文的理解,第五个是多模态的生成。
首先来看一下文学创作。
这就是我们文心一言的界面,先来看一个有关三体的例子。
三体的作者是哪里人?想先要知道三体作者是谁,然后要懂得哪里人是什么意思,因为是跟我老乡,所以第一个问题选了可以总结一下三体的核心内容,如果要续写的话,可以从哪些角度出发?
那么他总结了三体的第一步是什么意思?第二步在讲什么?第三步在讲什么?续写又是角色的塑造,情节设计、文化背景、哲学思考。
那么我们追问如何从哲学角度来进行续写生命的意义,人与宇宙的关系,道德和伦理价值和信仰,科技和人文的关系。
再问电视剧三体的演员都有哪些?他比较准确的列出了一系列的参与的演员,那么我们再问于和伟和张鲁一有哪些共同点?都是优秀的实力派演员获过多多个奖项,丰富的表演经验等等。
最后问于和伟和张鲁一谁更高?那么张鲁一比于和伟高三厘米。
我们看到在这一轮的问答当中总共有 6 轮对话,这些对话可以体现出文心一言总结分析能力、推理的能力还有总结的能力等等。
你要问谁和谁相比更高的话,你先得明白对这个人身高是多少,那个人身高是多少,然后再做一些比较很多这种事实性的东西。
这其实对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,它出错的概率还是挺高的,这些问题都答对相当不容易。
文心一言其实也采用了知识增强和检索增强,我们有 5500 亿的事实知识在训练数据里,所以可以相对来说保证事实性的问题能够比较准确。
第二个 Demo 是商业文案的创作。
好,如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,应该给它起个什么名字?信智科技、数字云图、云集科技、意象科技、魔方科技,好,数字云图这个名称不错。
那么给我起一个公司的服务的 slogan 来表达共赢的概念。
答案就是数智共赢、智慧未来。
当我生成一篇公司成立的新闻稿,数字云图,以共赢的服务理念,用大模型来服务中小企业的数字化升级,要求是 600 字左右,所以也生成了相应的新闻稿,我就不一个字一个字念了。
大家可以看到这里头涉及到相应的这种理解的能力,表达的能力,也包括一些这种创意创作的能力,这些个能力都是没有办法我们去一一的去教文心一言的,那么怎么做到的?
其实还是要有好的技术,要有大的数据,人们说读书破万卷,那么文心一言可能读了千亿万亿的页面,用了几十亿的搜索请求,用了很多的图片,用了我们全部的知识图谱的这些个 5500 亿的事实。
在不断训练的过程当中就逐步具备了一些比较通用的能力。
所以也有人讲说是大模型到了千亿的参数千这个参数达到千亿量级,那么又有足够多的训练语料数据来进行训练的时候就会发生什么现象?发生智能涌现,没有教过他的能力,他也会这个可以说是我们这方面的一个例子。
第三个 Demo,我们来演示一下数理逻辑的推算。
下面我们来玩一个鸡兔同笼的游戏。
问有多少只鸡多少只兔子?文心一言说这题好像出的不太对,算不出来了,我们改一下,重新问一遍。
解题思路是这样子,答案 3 只鸡和 6 只兔子,所以我们看到在这两轮提问当中展现出来的能力,使文心一言大语言模型它的数理逻辑的推理的能力,这方面它不仅知道就是提出的对不对,也不仅仅能够简单的给出来答案,那么也给出来了解题的步骤,这就很像是小学生在解这个应用题了。
它是有逻辑的一步一步的推理出来的。
这样的能力我们在过去一个月左右的这种内测当中,其实不断的看到文心一言在进步,虽然我们现在还不敢说是百分之百这类型的题都能做对,但是他的能力已经是挺强的了。
第四个 Demo,我们来演示一下对中文的理解。
因为百度是植根于中国市场的,我们理应在中文的理解和对中国文化的了解上,超出世界上任何一个预训练大模型。
" 洛阳纸贵 " 是什么意思?你必须得知道这个成语,你才能够明白才能答对。当时洛阳的纸到底有多贵,这就有点冷知识了,不是那么容易能够答对的。大家也看到好像涨了两三倍,这个成语在经济学原理里头对应的理论是什么?他很明确的答出来,这是一个需求定律,就是 " 物以稀为贵 "。
最后我们用洛阳纸贵来写一首藏头诗,每一个首字连起来是洛阳纸贵成语。
文心一言在中文理解能力和对中国文化的这种熟悉程度其实是相当高的,它也可以处理英文,只不过确实要承认他的对英文的这种理解和处理能力,现在还没有中文这么好。
部分原因是因为我们在训练数据里头给它注入的英文的数据还没有那么多,在接下来的时间我们会逐步的训练他英文以及其他语种的这些能力,以及将来这种跨语种的翻译推理的能力,那么大家有机会将来可以慢慢来尝试。
第五个 Demo 是多模态的生成。
请为 2023 世界智能交通大会来创作一张海报,那么大家看到其实反应是很快的,而且海报很有未来感也很贴切,那么你认为智能交通最适合哪个城市发展?上海、北京、广州、成都。好,再来一个多模,请用四川话将以上内容讲出来。
这时候发展智能交通的应该是那些具有较高人口密度,经济发达,交通需求量大的城市,接下来是一些可能适合的城市。
一上海作为中国最发达的城市之一,上海拥有着繁忙的交通网络和多元化的交通需求,自然交通可以帮助缓解城市家交通压力,提升城市交通效率,改善城市居民出行体验。好。
请将以上内容生成视频。
最适合发展智能交通的应该是那些具有较高人口密度,经济发达,交通需求量大的城市,以下是一些可能适合的城市。
一、上海作为中国最发达的城市之一,拥有着繁忙的交通网络和多样化的交通需求,智能交通可以帮助缓解城市交通压力,提升城市交通效率,改善城市居民出行体验。
二、北京是中国的政治中心、文化中心、国际交往中心。
大家看到生成的视频也是非常的相关,而且还挺美,所以我们这一轮交互分别看到它可以用文字生成图片,可以回答相关的问题,有一定创造性的问题可以用语音,方言大概就是我们演示了四川话,其实它广东话、东北话、闽南话什么也也都能讲,最后是用这些内容来生成视频。
前三个 Demo 现在文心一言的用户都可以用了。
第四个因为计算成本还是比较高,我们还没有对所有的一言的用户开放,但是如果你是百家号的创作者的话,你肯定对这个功能其实是不陌生的。现在大概每天有几万篇的百家号的文章,通过这个技术会自动的转成视频,在百度里头分发,所以这些技术我们已经都把它连起来了。
那么通过这 5 个例子的演示,大家会对文心一言行程一个基本的概念。
从文心一言的表现来看,它其实已经具备了很多像人类的这种对自然语言的理解的能力、表达的能力、逻辑推理的能力,这些个能力还在不断的完善的过程当中,我们有时候用的时候会感受到惊喜,有时候可能也会发现明显的错误。
但是有一点是肯定的,就是他的进步的速度非常的快。在未来的一段时间当中一定是一个日新月异的这样的状态。
我们通过对文心一言大模型进行微调,让他去适配百度内外各种各样的产品,那么就可以在用户界面或者说在用户体验上展示出来惊人的亲和力,让每一个产品都离自己的用户离自己的客户更近。
所以文心一言这样的一个大模型会成为每个人必不可少的生产力工具,无论是什么样的公司都不可能在几个月的时间里头靠突击做出来这样的技术,那么它是百度十几年超大规模的这种研发投入慢慢的积累出来的。
所以我们如果说来进一步解释文心一言到底怎么能做出来的话,我需要把我对于 IT 领域最近发生的一些变化来跟大家分享一下。
03
IT 技术的技术栈正在发生根本性变化
过去 IT 的技术站其实分为三层,一层是芯片层,上面是操作系统层,再往上就是应用层或者软件层。这个事情在 PC 时代、在移动互联网时代都是这个样子。
但是当我们进入 AI 时代的时候,IT 技术栈从 3 层变为了 4 层,也就是这里展示的芯片层。
当然芯片层跟过去的芯片也不太一样:过去以 CPU 为主,未来很可能会以 GPU 为主了。再往上我们叫做框架层,比如说像百度飞桨这样的叫做框架。
面就是模型层,今天文心一言就处在模型层。文心是百度整个模型的一个品牌,以后或者说 AI 时代的应用都会基于这些大模型来进行开发。所以以后不管是搜索也好、聊天也好、或者什么其他的应用,都会是基于域性链的这种大模型来进行开发。
百度每天比如说搜索有数十亿的这种检索请求,也就意味着文心大模型每天在服务数十亿的用户了,只不过,过去在服务搜索的时候,它是一个判别式的语言大模型。
今天文心一言的发布它是一个生成式的语言大模型。
为什么讲技术栈的变化?
大家知道生成式样的这种 AI 是非常耗算力的,有时候人们把它叫做暴力美学,要有大算力,要有大模型,要有大数据,那么费用相当的昂贵。4 层架构之间相互进行协同,不断的进行优化,就可以使它的效率比别人要高很多,就可以显著地降低成本,尤其是在框架层的模型层之间的这种协同,过去我们在几个月其实已经体会到了这方面带来的这种收益。
讲这 4 层,其实我真正想讲的是:在全球范围内、在芯片框架模型应用 4 层都有领先产品的公司,可以说是绝无仅有,百度就是那个唯一。
我们的优势非常独特,这个优势相信大家在未来的文心的迭代速度上可以会有明显的感受。
从 2 月 7 号我们正式官宣文心一言要发布以来,也就一个多月一点的时间,已经有 650 家的企业宣布接入文心一言的生态。这意味着很多企业其实已经明白这是一个大机会,这是任何一个企业都不应该错过的大的机会。
生成式 AI 它是代表了一个新的技术范式,它会带来市场需求的爆发性增长,商业价值的释放会是前所未有的、指数级的。
对于文心一言的定位,我们认为它是一个通用基础模型,在 4 层结构上看到可以有能源大模型,交通大模型,媒体大模型等等。
所以文心一言不仅仅会影响到搜索,也不仅仅是会影响到互联网公司,那么它会影响到每一家公司。由于它超强的自然语言理解能力、表达能力以及推理能力,它可以使得任何一个公司都能够离自己的客户更近。
也就是说,任何一个公司都有可能利用这些能力做出更好的用户体验,从而建立更强的竞争优势。
我看到有机构预测,到 2030 年脑力劳动者的生产效率会因为人工智能而与今天相比有 4 倍的提升,也就是说很多人他的工作性质会发生不可逆转的改变。
04
大语言模型将带来的三个产业机会
文心一言的发布,或者说生成式大模型的问世会带来哪些个创业机会、投资机会?我觉得至少有三方面。
首先我把它叫做新型云计算。
大家知道云计算在当下最主要的商业模式叫做 IaaS。这是公有云提供的基础云服务,主要是算例。那么现在今天在哪要建一个智算中心,通常是我要多少匹的算力对吧?主要是指的这个东西。未来的云计算公司主要的商业模式会变成 MaaS,以后的应用会建立在大模型上,而不是建立在过去的云计算的这些算力或者存储上。
这个对于云计算产业是一个 Game changer,是一个改变游戏规则的东西。
以前大家看你的基础云服务,看你的算力,看你的存储,今天会看你的模型好不好,你的框架好不好,你的芯片框架模型应用之间协同的好不好、效率高不高?
百度智能云会基于这套理念和这套架构对外去提供服务,赋能千行百业。
我们相信它会使得各行各业在提升效率、在各自领域的应用当中能够有很大的商业机会和效率的提升空间。
随后可能过两个星期,我们智能云会有一个单独的发布会,我们会具体介绍相关产品,既有的公有云服务也可以做私有化部署。
第二类机会我们把它叫做行业模型的精调。
刚才 4 层架构里头其实在模型层我们没有把文心放上去,而是放了各种各样的行业的这种大模型。
是因为我们觉得很可能是存在这么一个中间层的,任何一个行业都有它自己独特的数据,都有它对自己的行业的独特理解。这些个数据、理解和知识如果跟基础大模型进行结合,就会产生很强大的创造力和效率提升的能力。
这些个能力很可能不是百度所具备的,甚至这些数据也不是别人愿意给到百度的。那么这些能力在各个行业的精调可以避免我们刚才讲到的那些基础模型容易犯的错误,所以它的实用性会更强。
我们认为这也是一类新的商业机会。
第三个就是应用开发。
那么刚才大家看到文字的生成、图像的生成、音频的生成,以及我们熟悉的数字人三 D 等等,这些个能力一旦结合,再加上它超强的理解能力和表达能力,那么会创造出来很多新的可能性。
所以大模型时代真正最大的机会,既不在基础服务,也不在这个行业服务,我觉得恰恰是在应用。
就好像在移动互联网时代,最大的商业机会可能不是 iOS 或者说安卓这样的操作系统,而是微信、抖音、淘宝这些个应用一样。
那么在人工智能时代,我相信一定会出现杀手级的应用、现象级的新的产品,大家会不断看到一个个里程碑事件的发生。
最后我想说在文心一言发布之后,我们就会建立起来一个好的这种反馈闭环:用户的真实的反馈,开发者的模型的迭代以及开发者的调用之间会形成一个正向的循环,给大家士别三日当刮目相看,这样一个惊喜。
最后我想说,文心一言不是中美科技对抗的工具,而是一代代百度技术人员在追寻我们让科技改变世界的梦想当中的一个自然的结果,是我们服务亿万客户,赋能千行百业的最新的平台,更是创新驱动发展的最佳的证明。
谢谢大家的理解和支持。
END
本文作者:冯玮