cha

中国版ChatGPT角逐战,国际权威机构为百度背书

  机器之心原创

  作者:杜伟

  对标 ChatGPT,国内厂商真的可以做到。

  2023 开年以来,OpenAI 人机对话应用程序 ChatGPT 成为最火爆的科技热点,为 AI 大规模商业化落地提供了一个绝好的契机,受到了科技巨头们的追捧和追赶。

  ChatGPT 之所以能够成为现象级应用,很大程度上要归功于长久以来业界对大模型发展的重视。从 BERT 和 GPT-3 发展至今,大模型带来了 AI 开发新范式。日益完备和成熟的大模型成为了 AIGC 发展新引擎,催生了 AI 写作、AI 绘画等应用层面的产品。大模型技术的这波积累,让 ChatGPT 的火爆变得水到渠成。

  随着 ChatGPT 的出圈,很多国内大厂也开始支持类 ChatGPT 大模型研究。但想要做出对标 ChatGPT 的产品谈何容易,正如它基于大规模预训练模型 GPT-3.5 一样,国内大厂也要有坚实的大模型技术积累,否则便成了无源之水、无本之木。

  这就要问了,国内大模型厂商的实力如何?能否支撑起类 ChatGPT 的应用呢?近日,国际权威咨询机构 IDC 发布《2022 中国大模型发展白皮书》(以下简称 IDC 白皮书),让我们一窥国内主流大模型的发展现状。IDC 白皮书提出业界首个大模型评估框架,各厂商围绕核心算法与模型层、上层软件平台深入布局优化,其中百度文心大模型在产品、应用和生态能力上全面领先,让我们看到了打造中国版 ChatGPT 的实力和希望。

  此前 2 月 7 日,百度宣布将上线百度版 ChatGPT—— 文心一言,英文名为 ERNIE Bot。文心一言是百度基于文心大模型技术推出的生成式对话产品。文心一言究竟能否真正实现类 ChatGPT 的能力,我们或可以从文心大模型的能力展示中得出答案。

  产品、应用和生态三手抓、三手都要硬

  作为 AI 开发新范式,大模型能够增强 AI 的通用性和泛化性,还可以显著降低 AI 应用门槛。但若要实现这些目标,大模型不仅需要在能力构建上尽可能面面俱到,评价大模型好不好也不能仅看某一方面。

  针对大模型的能力,IDC 首次搭建了大模型评估框架 V1.0,并细化为了「1-3-6-11」架构,即 1 个整体评估框架、3 个评估维度、6 个一级指标和 11 个二级指标。

  首先是产品能力,它细分为 3 个一级指标,分别为模型能力、工具平台能力和开放性,主要考虑大模型的技术能力、功能丰富度以及底层深度学习平台的核心支撑能力。其次是应用能力,它细分为 2 个一级指标,主要考虑「大模型 + 深度学习平台」的应用广度、深度以及商业化前景。最后是生态能力,它主要考虑大模型市场生态布局情况。下图为 IDC 大模型评估框架 V1.0 整体概览。

  可以这么说,IDC 大模型评估框架 V1.0 从模型层、工具与平台层、应用与生态层进行了拆解,不仅让人们对大模型应有的能力有了一个非常清晰和全面的了解,而且为大模型评估提供了一套通用的标准。

  有了大模型评估框架 V1.0,IDC 对国内市场主流大模型厂商进行了评估,从宏观上了解它们当前的发展进程以及在哪些方面有所长、有所短。

  具体来讲,IDC 选取了国内主流厂商(N=9),根据产品能力、应用能力、生态能力以及各自细分下的共 11 项指标,通过定性和定量两种方式打分评估,并最终计算出各大厂商在不同维度的得分和平均分情况。

  如下图所示,IDC 将大模型在产品、应用和生态 3 个维度的能力划分为了 L1-L5 五个层级,层级越高代表厂商在大模型市场梯队中越靠前。2022 中国大模型评估结果显示,在当前大部分厂商能力处于 L2-L3 层级之时,百度文心大模型脱颖而出。除应用能力为 L3 水平之外,产品能力和生态能力均达到了 L4 水平,位列国内大模型市场格局第一梯队。

  百度文心大模型在产品能力方面呈现较强技术实力和平台积累,「文心大模型 + 飞桨深度学习平台」创新 AI 研发新范式,满足市场大规模落地需求,达到行业前端水平;应用能力方面落地广泛,在金融、能源、制造、城市、传媒和互联网等行业打造标杆案例,通过更契合场景需求的行业大模型加速落地,参与到客户业务流程关键环节中,应用深度与广度位列前沿;生态能力方面积极开展与开发者、行业用户、上下游产业的正向互动,处于行业领先地位。

  文心大模型又是如何做到产品、应用和生态能力的全面领先呢?这就要从文心大模型的核心特色、体系构建、深度学习平台持续赋能等多方面一一说起。

  能力全面领先,文心大模型厚积薄发

  深度学习领域「炼大模型」风潮已经持续至今,国内 AI 领头雁百度凭借其文心产业级知识增强大模型力求在竞争中保持领先优势,并不断通过技术创新、深化布局和拓展产业应用来增强自身实力。

  自 2019 年深耕预训练模型研发以来,百度在文心大模型历次升级中形成了自己的核心特色:知识增强和产业级。并且通过多年的技术探索与产业实践,百度文心大模型已经构建了「模型 + 工具平台 + 产品社区」三层体系。

  在模型层,文心形成了「基础、任务和行业」三级模型体系,致力于更精准的场景需求适配。基础大模型涵盖 NLP、CV 和跨模态三大方向,聚焦技术方向的挑战、通用性、泛化性探索。任务大模型包含对话、搜索、信息抽取、生物计算等多个典型任务,深入理解任务特性,打造紧贴任务的模型能力。11 个行业大模型与能源、金融、航天、制造、传媒等多个行业的头部企业或机构共建,融合行业数据、知识和专家经验,构建更适配行业的模型底座。

  在工具平台层,文心面向不同技术、业务背景的开发者,提供了全流程支持应用落地的工具和方法,满足定制化 AI 需求。这层主要包括新一代预训练范式的 NLP 算法定制开发工具集 ERNIEKit、面向应用开发者或业务专家的零门槛 AI 开发平台 EasyDL、面向 AI 算法开发者的全功能 AI 开发平台 BML 以及 NLP 大模型 ERNIE3.0、跨模态大模型 ERNIE-ViLG 和对话大模型 PLATO 的开放 API。

  在产品社区层,文心构建了旸谷大模型创意与探索社区,将大模型能力开放给各行各业和普通开发者。同时不断创新场景化产品,在文生图场景上推出业界首个 AI 艺术与创意辅助平台文心一格,实现一语成画;在搜索场景上推出基于大模型驱动的产业级搜索系统文心百中,通过搜索配置、数据导入和搜索体验三步完成搜索引擎构建。

  可以说,百度在中国科技企业中打造了最成熟的大模型产品体系和开发工具,为企业和开发者提供了丰富选择,并不断降低应用难度。

  同时,深度学习平台也为大模型发展与应用「保驾护航」。在百度,文心大模型 + 飞桨深度学习平台成为核心发展模式,并基于此构筑产业智能化基座。作为飞桨模型库的重要组成部分,文心大模型与飞桨融合发展、共享生态,带来更低门槛、更优效果、更标准化流程,推动 AI 技术创新和应用进入新阶段。

  文心大模型「模型 + 工具平台 + 产品社区」三层体系,加之飞桨深度学习平台支持,使其在 IDC 大模型评估框架中表现非常突出,成为百度打造文心一言的坚实技术根基。

  文心大模型致力于在千行百业、多样化应用场景兑现自己的能力,尤其为丰富的 AIGC 应用场景提供技术支撑,并已在智能对话、小说等文本生成,文本到图片、视频等跨模态生成有深入产业应用。此外,文心大模型不断助力文档智能场景、无人驾驶场景、工业质检场景等。

  百度文心成熟的大模型体系以及相关应用的落地实践,这一切都为文心一言将来在百度内外多样化场景中大显身手打好了样。

  打造中国版 ChatGPT,百度势在必行

  近些天,ChatGPT 已然成为了 AI 甚至整个科技圈的风向标。众多大厂虽有表态跟进类似研究,但深究之下,想要做出完全对标 ChatGPT 的产品,似乎只有百度有此实力。IDC 白皮书中的大模型评估结果是最好的例证,同时还有以下几个方面的原因。

  首先从整个 AI 布局来看,ChatGPT 相关的技术,百度都有。百度在其人工智能四层架构中具有全栈布局,包括底层芯片、深度学习框架、大模型和最上层的搜索等应用,贯通了 AI 全产业链,不存在卡脖子技术。尤其对于支撑 ChatGPT 的大模型技术,百度更不遑多让。凭借完备的「模型 + 工具平台 + 产品社区」体系,文心大模型实现了产品、应用和生态能力的全面领先,为做出文心一言准备好了条件。

  还有一点值得关注,从目前的信息来看,文心一言未来也会通过百度智能云对外提供服务,这也将根本性地改变云市场的游戏规则。之前选择云厂商更多看算力、存储等基础云服务,以后用户对云厂商的需求更加聚焦智能服务,会更多关注模型、框架、芯片以及应用,这四层架构之间的协同。

  其次,百度开发类 ChatGPT 产品也非从零开始,具有先发优势。早在 2019 年 3 月,百度就已发布预训练大模型 ERNIE 1.0,2020 年开始将文心大模型应用到搜索业务,赋能搜索相关性、深度问答和内容理解等,从大模型的投入到应用有着长期积累和产业实践。由此可见,文心一言有着丰富的成功经验可循。

  最后,国家、地方的政策支持为百度做出文心一言提供有利的大环境。国家「十四五」期间针对人工智能和大模型陆续出台相关指导方案和激励支撑政策,进一步加速大模型研发及应用落地。近日《2022 年北京人工智能产业发展白皮书》重磅发布,北京明确表态支持头部企业打造对标 ChatGPT 的大模型。

  内有文心大模型的长期技术积累、应用实践,外有国家政策的大力支持,可谓天时地利人和兼备,百度做出文心一言更显得顺理成章了。

  外界也对百度文心一言抱有极大期待,虽还未正式发布,便已受到众多知名企业的关注。爱奇艺、集度汽车(通过 Apollo)、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘、太平洋汽车网等名企纷纷宣布将加入文心一言生态圈,这势必进一步强化文心一言能力,拓展应用场景,加速 AI 商业化落地。

  1.抢中国版 ChatGPT 首发的公司们

  https://mp.weixin.qq.com/s/K7qhJhLkUY5eVJ1N506Zqg

  2.以落地考验价值,大模型的产业大考来了

  https://mp.weixin.qq.com/s/hifLvKT69Si8pPymoAVftA

  3.技术、生态和产业齐头并进,AI 发展进入「深度学习 +」阶段

  https://mp.weixin.qq.com/s/LHmS0dVy3WQKRj5fM63Axw


您可能还会对下面的文章感兴趣:

登录 注册 退出