cha

为ChatGPT提速10倍!芯片巨头放大招:AI的“iPhone 时刻”已来

  (原标题:为ChatGPT提速10倍!芯片巨头放大招:AI的“iPhone 时刻”已来)

  在AI浪潮扑面而来之际,芯片巨头英伟达再次丢出“核弹级“产品,并高呼“切勿错过AI的决定性时刻!”。

  当地时间周二,英伟达举办2023年春季GTC大会,CEO黄仁勋向开发者披露最新的硬件和AI应用软件进展。会上,他不仅多次提到生成式AI和ChatGPT,而且多次表示AI的“iPhone时刻”已经来临。

  此外,还围绕AI、量子计算、芯片等前沿科技,发布了一系列超级重磅的技术和产品。

  “我们正处在AI的iPhone时刻,初创公司竞相构建具有颠覆性的产品和商业模式,而老牌公司则在寻求应对之法,生成式AI引发了全球企业制定AI战略紧迫感,”

  黄仁勋表示,近四十年来,摩尔定律一直是引领计算机行业动态发展的重要规律,而计算机行业又影响着各行各业的发展,但在成本和功耗不变的情况下,性能的指数级增长已经放缓。

  然而,计算技术的发展日新月异,曲速引擎是加速计算,动力来源就是AI。各行各业正在应对可持续发展、生成式AI和数字化等强大的动态挑战,因此加速计算和AI的到来恰逢其时。

  黄仁勋表示,在过去十年中,加速和纵向拓展的结合,使我们能够为许多应用实现百万倍性能提升,进而有助于解决以前无法解决的问题。虽然存在很多示例,但最著名的一个是深度学习。

  “加速计算并非易事,2012年,计算机视觉模型AlexNet动用了GeForce GTX 580,每秒可处理262 PetaFLOPS。该模型引发了AI技术的爆炸。”“十年之后,Transformer出现了,GPT-3动用了323 ZettaFLOPS的算力,是AlexNet的100万倍,创造了ChatGPT这个震惊全世界的AI。崭新的计算平台出现了,AI的‘iPhone时刻’已经来临。”

  在黄仁勋的主题演讲中发布了全新的GPU推理平台。

  该平台包括4种不同配置,针对不同工作负载进行优化,分别对应了AI视频加速、图像生成加速、大型语言模型(LLM)加速和推荐系统和LLM数据库。包括:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超级芯片。

  据悉,H100 NVL是专门为LLM设计的GPU,采用了Transformer加速解决方案,可用于处理ChatGPT。

  “当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比,现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍,可以将大语言模型的处理成本降低一个数量级。”

  另外,英伟达最新确认,H100 NVL预计将在今年下半年上市。

  另外,L4是针对AI生成视频的通用GPU,用于加速AI视频,可以提供比CPU高120倍的性能,能效提升约99%。

  L40则是用于图像生成,针对2D、3D图像生成进行优化,并可以结合Omniverse,直接生成3D内容,甚至是元宇宙内容。其性能是英伟达最受欢迎的云推理GPU T4的10倍。

  Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。

  除此之外,在GTC大会上,英伟达还发布了AI超级计算服务DGX Cloud、突破性的光刻计算库cuLitho、云服务NVIDIA AI Foundations等,以及与Quantum Machines合作推出了全球首个GPU加速量子计算系统。

  其中,DGX Cloud提供了专用的 NVIDIA DGX AI超级计算集群,用户能够按月租用这些计算资源,并使用简单的网络浏览器访问。从而消除在本地获取、部署和管理基础设施的成本,大大增加了AI的便捷性。

  该服务目前已经与Microsoft Azure、Google GCP和Oracle OCI开展合作。每个DGX Cloud实例都具有八个H100或A100 80GB Tensor Core GPU,每个节点共有640GB GPU内存。

  另外,发布的光刻计算库cuLitho可将计算光刻加速40倍以上。

  “计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。大型数据中心24x7全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。”

  据悉,全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。该计划旨在加快制造光掩模的任务,光掩模是塑造光投射到硅晶片上以制造电路的方式的屏幕。

  最新发布的全新云服务及代工厂NVIDIA AI Foundations包括语言、视觉和生物学模型制作服务。

  另外,英伟达还推出了量子计算。英伟达与Quantum Machines合作推出了一个量子控制链路。它可将英伟达GPU连接到量子计算机,以极快的速度进行纠错。据悉,NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统,可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟。


您可能还会对下面的文章感兴趣:

登录 注册 退出