cha

中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图1)

  文丨潘几鹤

  颠覆,这个词频繁地用在ChatGPT身上。

  只用了2个月,这个诞生于硅谷的人工智能聊天机器人,实现日活破亿,成为截至目前互联网史上用户增速最快的消费级应用。

  中国科技圈亦热闹非凡,据不完全统计,已有数十家公司宣布进军ChatGPT,开出百万年薪抢人。

  业内翘首以盼国产ChatGPT,AI实力满满的百度,一举一动成为焦点。

  2月初,百度宣布,计划推出类ChatGPT的应用,取名“文心一言”,正在做上线前的冲刺。近日,已经有超过200家合作伙伴宣布与文心一言合作。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图2)

  “目前来看,百度是最有可能做出中国版ChatGPT的企业。”中国传媒大学媒体融合与传播国家重点实验室大数据中心首席科学家沈浩,做了如此判断。

  ChatGPT与大模型能力深度挂钩。

  近日IDC发布的《2022中国大模型发展白皮书》,为评估国内厂商大模型实力分布提供了权威参考,百度文心大模型,毫不意外地进入第一梯队,产品能力、生态能力、应用能力全面领先。

  百度能否撑起门面,对此的探讨,得回归技术本身。

  AI顶流的内核

  ChatGPT能掀起如此大的讨论度,在于其第一次让大众感受到,AI回答问题的方式可以如此贴近人类。

  它具备记忆能力,可连续对话,敲代码、撰写论文等手到擒来,似乎无所不能。

  ChatGPT“上知天文、下知地理”的能力,源自大模型。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图3)

  来源:视觉中国

  按IDC的定义,AI大模型是基于海量多源数据打造的预训练模型,发端于自然语言处理领域,国内以百度文心大模型为代表,具有泛化性、通用性、迁移性的特点。

  过去,在分散化的模型研发模式下,单一AI应用场景的多个任务需要由多个模型共同支撑完成。

  有了大模型带来的“预训练+精调”新范式,AI模型就能在更统一、简单的方式下规模化生产,可谓打通AI技术通用性的“任督二脉”。

  训练开发大模型,对技术要求极高,需要消耗密集和昂贵的算力资源,数据、算法和算力相互耦合,三项能力缺一不可。

  以数据量来看,超大规模的模型参数正持续增长,目前在千亿、万亿级别。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图4)

  据预测,OpenAI开发中的最新大型语言模型GPT-4,将包含约100万亿的参数——与人脑的突触在同一数量级。

  有研究估测,训练1750亿参数语言大模型GPT-3,需要上万个CPU/GPU 24小时不间断输入数据,所需能耗相当于开车往返地球和月球,一次运算就要花费450万美元。

  大模型的技术特点决定了,高昂的研发门槛、持续的资金消耗,是中小型创业公司无法轻易尝试的生意。反过来讲,它是天生就适合巨头加注的竞赛场。

  事实上,主流大模型,仅由科技巨头以及少数研究机构掌握。在探索ChatGPT这类前沿AI产品上,拥有强大算力的玩家具备更强的竞争力。

  百度的机会

  ChatGPT拉动下,AI大模型应用的元年,或许真的来了。面对前所未有的时间窗口,中国大模型厂商的实力究竟如何?

  在《2022中国大模型发展白皮书》中,IDC提出了行业首个大模型评估框架,基于模型能力、工具平台能力等6个维度的11项指标,评估各厂商的水平。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图5)

  IDC指出,进入第一梯队的百度文心大模型,产品能力、生态能力、应用能力均处在领先位置,具有产业级、知识增强两大特色。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图6)

  在产品能力上,文心大模型呈现出较强技术实力和平台积累,“文心大模型+深度学习平台”创新人工智能研发应用范式,能满足市场大规模落地需求。

  背靠海量知识积淀和丰富应用场景,百度构建起一套“大模型+工具平台+产品与社区”的三层体系,形成支撑大模型产业落地的关键路径。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图7)

  文心的行业引领性,离不开超前战略眼光,以及百度在AI领域数十年如一日的积累。

  2019年初,百度率先发布国内首个正式开放的预训练模型ERNIE 1.0,开始大模型的升级锻造之路。

  当年,在自然语言处理领域的权威数据集GLUE中,百度ERNIE一举登顶,首次突破90分大关,刷新榜单历史。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图8)

  大模型路线逐渐成为学术界及产业界的发展共识,百度在这条路上也越走越深。

  2022年,百度在业内首次提出行业大模型的思路,帮千行百业化繁为简地享受AI带来的技术红利。

  开发工具成熟、产品体系完善、落地路径清晰,放眼国内,具备综合优势的百度,开发中国ChatGPT几乎是从半山腰开始往上爬,相较站在山脚下、从零起步的厂商,领先了N个身位。

  “中国的技术积累和发展,已形成能培育类ChatGPT产品的肥沃土壤。”

  沈浩表示,借助百度强大的检索增强和知识增强能力,文心一言的面世值得期待。

  引爆新风潮

  跳出大模型的视角,俯瞰百度AI技术全景,人工智能所需的算力、数据和算法,百度同时具备;芯片、框架、模型、应用四层技术栈,百度全栈深度布局,均拥有关键自研技术。

  随着文心一言加入文心大模型家族,百度在大模型能力上的千锤百炼,有了新的抓手。由此,拓展AI应用场景和扩大自身业务基本盘,是顺理成章的事情。

  可以预见的是,ChatGPT产生的鲶鱼效应,将推动AI产业化进程。即将上线的文心一言,会引爆新一轮风潮,直面全球AI混战。

  这里面有两个要点值得注意:

  其一,文心一言助力下,百度将加速推进文心大模型深入产业落地。

  目前,百度与多家头部企业、机构联手,研发融合行业数据、知识以及专家经验的行业大模型。

  截至2022年11月,公司累计发布11个行业大模型,涵盖金融、航天等领域。

  文心一言的生态版图不断扩大——媒体、家电等不同行业的多家合作伙伴,纷纷宣布成为其首批先行体验官。

  全面支持合作伙伴,共同发展商业市场,会是文心接下来的一大方向。

  其二,云服务的选型思路,过去看算力、存储等基础指标,逐渐转向关注智能服务维度。文心一言、ChatGPT带来新的业务模式,可能颠覆传统云服务。

  中国版ChatGPT,百度发出大模型关键一击|文心|模型|百度(图9)

  文心一言的根扎在百度智能云上,未来它将通过百度智能云对外提供服务,作为平台开放给第三方开发应用。

  一方面,这将为百度智能云带来更多商业化可能,打开新的想象空间;另一方面,意味着改变云计算市场的游戏规则,搅动云厂商市场格局。

  这一轮全球AI竞速,执先手的百度,爆发期已近。行业期待由百度这样的企业领衔,实现真正自主自研的国产ChatGPT,助力大模型崛起。

  中长期来看,引领新一轮技术迭代,唤醒更多有志者加入技术创新队伍,推动产业生态共荣,将是文心一言更深远的意义。

  特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。


您可能还会对下面的文章感兴趣:

登录 注册 退出