为ChatGPT提速10倍!英伟达放大招:AI的“iPhone 时刻”已来
在AI浪潮扑面而来之际,芯片巨头英伟达再次丢出“核弹级“大招,并高呼“切勿错过AI的决定性时刻!”。
当地时间周二,英伟达举办2023年春季GTC大会,CEO黄仁勋向开发者披露最新的硬件和AI应用软件进展。会上,他不仅多次提到生成式AI和ChatGPT,而且多次表示AI的“iPhone时刻”已经来临。
此外,还围绕AI、量子计算、芯片等前沿科技,发布了一系列前沿技术和产品。
AI的“iPhone 时刻”已来
“我们正处在AI的iPhone时刻,初创公司竞相构建具有颠覆性的产品和商业模式,而老牌公司则在寻求应对之法,生成式AI引发了全球企业制定AI战略紧迫感,”
黄仁勋表示,近四十年来,摩尔定律一直是引领计算机行业动态发展的重要规律,而计算机行业又影响着各行各业的发展,但在成本和功耗不变的情况下,性能的指数级增长已经放缓。
然而,计算技术的发展日新月异,曲速引擎是加速计算,动力来源就是AI。各行各业正在应对可持续发展、生成式AI和数字化等强大的动态挑战,因此加速计算和AI的到来恰逢其时。
黄仁勋表示,在过去十年中,加速和纵向拓展的结合,使我们能够为许多应用实现百万倍性能提升,进而有助于解决以前无法解决的问题。虽然存在很多示例,但最著名的一个是深度学习。
“加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForce GTX 580,每秒可处理262 PetaFLOPS。该模型引发了AI技术的爆炸。”“十年之后,Transformer出现了,GPT-3动用了323 ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世界的AI。崭新的计算平台出现了,AI的‘iPhone时刻’已经来临。”
为ChatGPT提速10倍!
在黄仁勋的主题演讲中发布了全新的GPU推理平台。
该平台包括4种不同配置,针对不同工作负载进行优化,分别对应了AI视频加速、图像生成加速、大型语言模型(LLM)加速和推荐系统和LLM数据库。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超级芯片。
据悉,H100 NVL是专门为LLM设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。
“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”
另外,英伟达最新确认,H100 NVL预计将在今年下半年上市。
另外,L4是针对AI生成视频的通用GPU,用于加速AI视频,可以提供比CPU高120倍的性能,能效提升约99%。
L40则是用于图像生成,针对2D、3D图像生成进行优化,并可以结合Omniverse,直接生成3D内容,甚至是元宇宙内容。其性能是英伟达最受欢迎的云推理GPU T4的10倍。
Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。
还有这些重磅产品
除此之外,在GTC大会上,英伟达还发布了AI超级计算服务DGX Cloud、突破性的光刻计算库cuLitho、云服务NVIDIA AI Foundations等,以及与Quantum Machines合作推出了全球首个GPU加速量子计算系统。
其中,DGX Cloud提供了专用的 NVIDIA DGX AI超级计算集群,用户能够按月租用这些计算资源,并使用简单的网络浏览器访问。从而消除在本地获取、部署和管理基础设施的成本,大大增加了AI的便捷性。
该服务目前已经与Microsoft Azure、Google GCP和Oracle OCI开展合作。每个DGX Cloud实例都具有八个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。
另外,发布的光刻计算库cuLitho可将计算光刻加速40倍以上。
“计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。大型数据中心24x7全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。”
据悉,全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。该计划旨在加快制造光掩模的任务,光掩模是塑造光投射到硅晶片上以制造电路的方式的屏幕。
最新发布的全新云服务及代工厂NVIDIA AI Foundations包括语言、视觉和生物学模型制作服务。
另外,英伟达还推出了量子计算。英伟达与Quantum Machines合作推出了一个量子控制链路。它可将英伟达GPU连接到量子计算机,以极快的速度进行纠错。据悉,NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟。