“这是AI的iPhone时刻”,芯片巨头发布ChatGPT专用GPU:速度快十倍!未来将与中国云服
每经记者 文巧 杨卉 每经编辑 王月龙 高涵 文多 盖源源
借AI浪潮翻身的显卡龙头英伟达(NVDA,股价261.99美元,6471亿美元)正试图乘胜追击。当地时间3月21日,2023年GTC大会上,英伟达创始人兼首席执行官黄仁勋发布了四款AI推理芯片、三个大模型云服务、超级计算机,以及针对场景优化的应用100个、更新功能的工业元宇宙Omniverse。
同时,英伟达还计划开放DGX Cloud实例,其中每个实例配有8个 H100或A100 80GB GPU,企业可以“云租赁”的形式按月租用DGX Cloud集群,价格为每实例3.7万美元/月起。根据介绍,DGX Cloud能为AI超级计算提供完整的解决方案,借助该集群,企业用户可扩展大型多节点训练工作负载的开发,无须等待需求量通常很大的加速计算资源。
3月22日一早,身穿标志黑皮夹克的黄仁勋接受了《每日经济新闻》等媒体的采访。黄仁勋表示,随着AI浪潮的涌进,未来将出现两个拐点,一是人工智能工厂的出现,第二点则是未来的每一个应用程序都将与生成式人工智能相连。“许多年轻的创业公司正在建立大型语言模型,并由此进入生成式人工智能革命,英伟达正以几种不同的方式为这一切做准备,其中一种就是将所有内容放入云中。”
当前很多公司——尤其是开发大型语言模型的中小型公司,都在担心计算能力不足,谈及英伟达计划何时将云服务提供给中国客户时,黄仁勋并未给出具体规划,但他也直言,将在中国与云服务提供商合作。
“(我们)将完全遵守所有的出口控制和法规,它们(云服务产品)将在中国的云公司中实施。阿里巴巴、腾讯、百度等都是优秀的合作伙伴,我完全期待他们拥有最先进的系统来进行人工智能计算。”黄仁勋直言,当前市场对算力、生成式AI的需求极为旺盛,由于其余行业目前仍不是超级活跃,公司将有能力在此领域提供大量的供应。
3月22日,A股英伟达概念股持续走强。截至发稿,宣亚国际20%涨停,中富通涨超16%,鸿博股份封板。
图片来源:英伟达
多年来,黄仁勋一直倡导AI和机器学习,长期押注AI的潜力也注定了英伟达是ChatGPT浪潮中受益最多的公司之一。因为,对于大型语言模型来说,算力是其中最重要的一环,因此高度依赖英伟达强大的GPU芯片。
如今,谷歌、亚马逊等正在自研芯片的科技巨头,英伟达的未来之路并不好走。有分析认为,英伟达不太可能和巨头在云服务上直接竞争,但可能会推出特定的AI产品。此外,鉴于微软是唯一一家尚未推出AI芯片的超大规模厂商,其与英伟达的合作对双方来说意义重大。“英伟达可以更好地耕耘数据中心,微软不一定需要通过构建基础设施来与亚马逊竞争,而是依靠前者成为AI最大的参与者之一。”
AI正迎来“iPhone时刻”
GTC开发者大会于3月20日~23日举行,本届大会将举办超过650场由技术、商业、学术和政府领域领导者主持的会议。
在3月21日晚的主旨演讲中,黄仁勋介绍了英伟达在AI领域的最新进展,并展示了这些技术在包括科技、医疗、金融、图像、物流配送等各行各业的应用场景,并宣布了包括量子硬件公司 Anyon Systems、Atom Computing、电信巨头AT&T Corp、医疗保健技术提供商美敦力、甲骨文、Adobe、Getty Image等一批全新的合作伙伴。
图片来源:英伟达
“我们正处于AI的iPhone时刻,”黄仁勋说道,“初创公司正在竞相打造颠覆性产品和商业模式,而科技巨头们也在寻求突破。”他表示,新的AI技术和迅速蔓延的应用正在改变科学和各行各业,并为成千上万的新公司开辟新的疆域。这将是迄今为止最重要的一次GTC。
《每日经济新闻》记者总结了英伟达最新发布的几个重大进展。
1. DGX Quantum
英伟达宣布和Quantum Machines推出DGX Quantum,这是首个结合GPU和量子计算的系统,使用新的开源CUDA Quantum软件平台,该系统为从事高性能和低延迟量子经典计算的研究人员提供了革命性的新架构。
其中最主要的是H100 NVL,它将英伟达的两个H100 GPU拼接在一起,以部署像ChatGPT这样的大型语言模型(LLM)。“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”黄仁勋说。
2. DGX? Cloud
英伟达宣布推出NVIDIA DGX? Cloud,这是一项AI超级计算服务,能让企业立即访问为生成式AI和其他突破性应用程序训练高级模型所需的基础设施和软件。企业可按月租用DGX Cloud集群,确保快速轻松地扩展大型多节点训练工作负载的开发,而无需等待通常需求量很大的加速计算资源。微软Azure预计将在下个季度开始使用DGX Cloud,并且该服务将很快扩展到谷歌云。
3. BioNeMo Cloud
英伟达公布了全新的BioNeMo云服务,用于定制AI基础模型,以加速新蛋白质和疗法的创造,以及基因组学、化学、生物学和分子动力学领域的研究,安进和其他十几家生物科技初创公司已经接入该服务。
4. CV-CUDA
英伟达还公布了CV-CUDA测试版,这是一个用于云规模计算机视觉的开源GPU加速库。黄仁勋透露,微软、腾讯和百度等公司都正在采用CV-CUDA进行计算机视觉AI研究。
5. 将加速计算带入计算光刻领域
此外,英伟达宣布了一项突破——将加速计算带入计算光刻领域,使ASML、台积电和Synopsys等半导体领导者能够加速下一代芯片的设计和制造。
黄仁勋喊话硅谷初创企业:
A100芯片是大模型必备
黄仁勋将GPT-4等生成式AI模型的能力增长描述为“计算的新时代”。他认为,对于许多公司来说,在获得使AI运行所需的资源和技能方面,仍然面临“无法逾越的障碍”,这也是英伟达提供AI服务业务的原因。具体来说,客户直接从该公司购买AI服务,部署预训练生成式AI模型,并利用该公司的DGX AI超级计算机。
而英伟达长期押注AI的决定了该公司是从ChatGPT浪潮中受益最多的公司之一,因其强大的GPU被用于训练GPT-4模型,以及用来运行AI超大规模云提供商服务器上的工作负载。GPU是其主要业务,占该公司收入的80%以上。
GPU即图形处理器,是一种专门在个人电脑、工作站、游戏机和一些移动设备上做图像加速和通用计算工作的微处理器。“大约十年前,我们就看到,这种做软件的方式可以改变一切,”黄仁勋在近期接受CNBC采访时这样说道,“我们制造的每一个芯片都专注于AI,这从各个方面改变了英伟达。”
事实证明,这是英伟达做过的最正确的决定之一。对于研究大型语言模型的公司来说,算力是其中最重要的一环,AI大模型的推理和训练高度依赖英伟达的GPU芯片。缺少芯片会导致算力不足,计算能力不足意味着无法处理庞大的模型和数据量,最终的结果是模型存在智商差距。美国银行证券的半导体分析师Vivek Arya作了一个比喻,“计算能力现在基本上是硅谷的货币。”
鉴于英伟达在高性能GPU方面的技术领先地位,一些云计算专业人士认为,1万颗英伟达A100芯片是一个好的AI模型的算力门槛。而微软为OpenAI构建的用于训练其模型的AI超级计算机就配备了1万颗英伟达的GPU芯片。
A100芯片是英伟达性能最好的芯片,现在售价约为1万美元。市场研究公司TrendForce在一份报告中计算得出,要处理1800亿参数的GPT-3.5大型模型,需要的GPU芯片数量高达2万颗,未来GPT大模型商业化所需的GPU芯片数量甚至会超过3万颗。
黄仁勋在接受CNBC采访时回忆道,大概五年前,当英伟达生产出第一个超级AI芯片时,他亲手把这片芯片交给了ChatGPT的开发商OpenAI,这也是全球首个这样的芯片。
如今,ChatGPT席卷全球,黄仁勋表示,“我们是全球AI的发动机。全球有超过3.5万家公司——不论是科技巨头还是初创企业,都在使用英伟达的产品来开发AI,领域从消费者互联网、生物科学到机器人研发等。”
他同时还喊话硅谷初创企业,称英伟达还有很多A100芯片。他表示,今天的AI行业,非常像手机的iPhone时刻,是一个革命性的转变时刻。“对今天的创业者来说,创业是和AI一起进行的,A100芯片驱动的超级AI计算机将成为你的创业伙伴。里面的算法、庞大的数据等等都将成为创业计划的一部分,这是一个很大的转变,这也将成为AI行业的分水岭。”他这样说道。
外界普遍认为,英伟达的AI系统很贵,只有科技巨头才能买得起。黄仁勋说,“AI数据中心现在的价格是1亿美元,但是可以由100家公司共同使用,因此,这些成本对这些公司来说,基本上是九牛一毛。而且从芯片研发的角度来说,我们花了20到30亿美元才研发出来A100这款AI芯片。更不要说我请芯片代工厂制造这些芯片,以及用这些芯片来进行大规模语言模型训练产生的成本了。”
英伟达未来:推出AI特定产品
与微软“强强联合”
自ChatGPT掀起这场AI风暴后,英伟达股价节节走高。今年年初至今,英伟达股价的涨幅已超80%。黄仁勋表示,并没有预见今天的一切,也不把英伟达的成功视作是幸运。
“我预见的是,加速计算机的发展,而不是AI的发展,”黄仁勋这样说道,“我们做了很多伟大的决定,包括搭建平台,并且让每个人都能够连接到这个平台,和全球的研究型大学建立联系等。我们只是相信,在某一天,总有一些新的东西会出现。”
英伟达在AI芯片上的部署也帮助其数据中心收入在2020年首次超过游戏部门,企业相关收入目前占该公司收入的大部分。上个月,英伟达发布了2023财年第四季度的财报,数据显示,该公司的数据中心业务再次成为最大的收入来源,该业务营收在当季同比增长11%,但环比下降6%。
图片来源:Tech Monitor
但是,由于经济放缓,英伟达的总体收入停滞不前。财报显示,2023财年第四季度营收为60.5亿美元,同比下滑21%。尽管如此,上个季度它的表现略好于市场预期,这主要是基于AI芯片的销售。
Gartner分析师Alan Priestley表示,尽管市场上大型语言模型和相关工具的数量与日俱增,但英伟达的GPU不太可能很快出现供不应求的情况。“目前对高端性能的需求正在推动英伟达的业务,”他表示,“我们仍处于这种生成式AI趋势的斜坡上,没有人真正知道它会在哪里结束。”
Alan Priestley认为,英伟达的中长期前景不太明朗。因为,它不得不与一些想要分一杯羹的科技巨头抗衡。例如,去年10月,谷歌发布了其最新的Tensor处理单元,这些单元经过优化来训练和运行AI和机器学习模型;亚马逊市场领先的云平台AWS也拥有自己的内部芯片。“我们将看到这种情况越来越多地发生,”Priestley说道。
面对日益激烈的竞争,Forrester高级分析师Tracy Woo认为,英伟达有可能会提供能与超大规模厂商竞争的服务和产品。不过,大众不太可能看到英伟达推出面向所有业务的云服务(与超大规模厂商竞争的启动成本至少为10亿美元),但可能会看到特定用于AI的产品。
Woo说:“没有人会尝试全面与超大规模企业竞争,但你可以试图去蚕食某些市场领域,因为他们(超大规模企业)不一定能主宰一切。”
除此之外,Woo表示,英伟达与微软的合作意义重大,后者是唯一一家尚未推出AI芯片的超大规模厂商。两家公司在去年11月宣布了一项“多年合作”,微软将使用英伟达的GPU在其Azure云平台上构建强大的AI超级计算机。
另一方面,Woo表示,与英伟达保持紧密联系可能也是微软与亚马逊竞争对手保持同步的一种方式。“这可能是一个非常富有成效的合作伙伴关系,他们都能从中受益,”她说道,英伟达可以更好地耕耘数据中心,而微软不一定需要通过构建自己的基础设施来与亚马逊竞争,而是依靠前者成为AI最大的参与者之一。
声明:文章内容和数据仅供参考,不构成投资建议。投资者据此操作,风险自担。
记者|文巧 杨卉
编辑|王月龙 高涵 文多?盖源源
校对|何小桃
|每日经济新闻 ?nbdnews原创文章|
未经许可禁止转载、摘编、复制及镜像等使用