cha

拆解华为盘古大模型:与 ChatGPT 有何不同?

  本文来源:时代周报 作者:杨玲玲 郑栩彤

  AI 大模型热潮持续,国内多家科技企业已走出不同路径:百度集团(BIDU.NASDAQ,09888.HK)发布文心一言,成为中国第一个类 ChatGPT 产品;阿里巴巴(BABA.NYSE,09988.HK)的类 ChatGPT 产品通义千问,也在近日开启外部测试。

  而市场传言,华为亦将加入大模型竞赛,发布 " 盘古系列 AI 大模型 ",但时代周报记者未在华为云官网找到相关信息,咨询华为云相关人员 " 盘古系列 AI 大模型 " 上线时间也没有得到明确答复。

  4 月 8 日,华为云人工智能领域首席科学家田奇在人工智能大模型技术高峰论坛上发言。论坛上,田奇并未透露关于盘古大模型的最新变化和产品计划,亦未透露更多 NLP 大模型的消息,而该模型是被认为最接近人类中文理解能力的 AI 大模型。

  但田奇表示,华为云盘古大模型推动人工智能开发从 " 作坊式 " 到 " 工业化 " 升级。目前,华为已陆续发布矿山、气象、海浪等系列盘古行业大模型,展望未来,AI for Industries 是人工智能新的爆发点。

  拆解华为盘古大模型:与 ChatGPT 有何不同?(图1)图源:田奇演讲 PPT

  当大厂们相继涌入大模型赛道,各行各业纷纷接入大模型提供的 AI 能力,预示着一场声势浩大的技术革命悄然发生,新的产业风口正在形成。风口之下,华为盘古大模型与其他 " 类 ChatGPT" 产品究竟有何不同?

  拆解盘古大模型

  田奇的演讲内容并不新颖。在 3 月举办的博鳌亚洲论坛 2023 年年会上,田奇就称 "AI for industries 将成为人工智能新的爆发点 "。

  对于广受关注的盘古 NLP 大模型,田奇透露的细节不多,而这一大模型正是 ChatGPT、文心一言、通义千问等近期走红的大模型所属的技术领域。

  会上,田奇只简单介绍称,目前,在 NLP 大模型上,华为盘古聚焦文本生成与内容理解,已进入智能文档搜索、智能 ERP、小语种大模型领域,落地企业财务异常检测、阿拉伯语大模型等场景。

  市场对盘古新 NLP 模型的期待,来自于这一模型此前的突出表现。资料显示,2019 年的权威中文语言理解测评基准 CLUE 榜单中,盘古 NLP 大模型在总排行榜及分类、阅读理解单项的排名均为第一,总排行榜得分 83.046,接近 85.61 的人类水平。

  上海证券分析师陈宇哲在研报中称,在早前的华为开发者大会上,华为曾宣布盘古大模型是业界首个千亿级生成与理解中文的 NLP 大模型,其认为未来有望成为国内最强的 Chat GPT 应用。

  演讲的后半段,田奇重点介绍了盘古 CV 大模型和科学计算大模型,以及它们的应用场景。比如,CV 领域的矿山大模型、基于盘古 CV 大模型的铁路巡检方案等,以及科学领域的盘古气象大模型、药物分子大模型、海浪预测大模型。

  其中,盘古矿山大模型通过 5G+AI 全景视频拼接综采画面卷,传输到地面,地面工作人员将来可以实现地面控制机器进行采矿,实现矿下无人少人安全作业;华为云盘古气象大模型,可实现 20 公里范围内、小时级、13 层最高精度气象预报,如台风生成时间与移动硅基的预测准确率达 85% 以上;华为云盘古药物分子大模型,让先导药的研发周期从数年缩短至 1 个月,同时降低 70% 的研发成本。

  浙商证券分析师陈杭撰写研报表示,在 ChatGPT 背后,不断迭代的 GPT 系列使得大模型成为当下科技企业核心竞争力的重要体现,未来,大模型将成为 AIGC 时代的核心支撑。华为作为国内科技龙头,2021 年发布的盘古大模型有望在 AIGC 时代中引领潮流。

  大模型洗牌提速

  加入华为之前,田奇已经是 AI 领域业界知名的学者。2020 年 3 月,田奇加入华为云后便开始组建团队并进行方向梳理;9 月,团队开始推动盘古大模型的立项,希望能够在华为云的产业基座上,完成适配各个产业 AI 开发的大模型;11 月,盘古大模型在华为云内部立项成功,并完成与合作伙伴、高校的合作搭建。

  据媒体报道,支撑盘古大模型不断攻坚克难的团队,起初仅有几个人,他们是让盘古大模型得以从实验室走向产业的中坚力量。随后,团队逐渐壮大起来,拥有 20 多名博士、30 多名工程师、3 名广受关注的 " 华为天才少年 ",还有 50 多名来自全国 C9 高校的专家。

  要打造一个属于中文世界,并且适配各种真实产业场景的 AI 预训练大模型,摆在研发团队面前的是两大门槛。

  拆解华为盘古大模型:与 ChatGPT 有何不同?(图2)图源:图虫创意

  一个是技术门槛,大模型需要卓越的并行优化来确保工作效率,这对网络架构设计能力提出了更高的要求;第二是资源门槛,大模型训练需要极大的算力,在训练千亿参数的盘古大模型时,团队调用了超过 2000 块的昇腾 910,进行了超过 2 个月的训练。

  2021 年 4 月,盘古大模型正式对外发布。盘古大模型发布以来,已经发展出 L0、L1、L2 三大阶段的成熟体系持续进化。

  所谓 L0,是指 NLP 大模型、CV 大模型等五大水平领域的基础大模型;而 L1 指行业大模型,比如气象、矿山、电力等行;L2 指面向各行业中细分场景的模型,比如电力行业的无人机巡检。

  去年 9 月,华为轮值董事长胡厚崑在 2022 世界人工智能大会上表示,华为云盘古预训练大模型已完成从学术大模型到产业大模型的转变,形成 " 基础大模型 - 行业大模型 - 细分场景大模型 " 的发展路径,并且在医疗、互联网、金融、煤矿、农业、气象等领域中实现降本增效。

  如今,随着华为、百度、阿里、腾讯(00700.HK)等科技企业陆续推出相应产品,以及商汤科技(00020.HK)、科大讯飞(002230.SZ)宣布发布计划,大模型赛道将进一步拥挤,市场普遍认为,未来大模型市场势必将迎来新一轮的整合与洗牌。

  田奇也在分享中提到,未来 " 大模型将成为应对 AI 领域应用碎片化的一种方式,相较于此前不同场景对应不同小模型的状况,未来大模型有可能收编高度定制化的小模型,导致市场向大公司集中 "。


您可能还会对下面的文章感兴趣:

登录 注册 退出