为ChatGPT提速10倍！英伟达放大招：AI的“iPhone 时刻”已来

2023-03-22

　　在AI浪潮扑面而来之际，芯片巨头英伟达再次丢出“核弹级“大招，并高呼“切勿错过AI的决定性时刻！”。

　　当地时间周二，英伟达举办2023年春季GTC大会，CEO黄仁勋向开发者披露最新的硬件和AI应用软件进展。会上，他不仅多次提到生成式AI和ChatGPT，而且多次表示AI的“iPhone时刻”已经来临。

　　此外，还围绕AI、量子计算、芯片等前沿科技，发布了一系列前沿技术和产品。

　　AI的“iPhone 时刻”已来

　　“我们正处在AI的iPhone时刻，初创公司竞相构建具有颠覆性的产品和商业模式，而老牌公司则在寻求应对之法，生成式AI引发了全球企业制定AI战略紧迫感，”

　　黄仁勋表示，近四十年来，摩尔定律一直是引领计算机行业动态发展的重要规律，而计算机行业又影响着各行各业的发展，但在成本和功耗不变的情况下，性能的指数级增长已经放缓。

　　然而，计算技术的发展日新月异，曲速引擎是加速计算，动力来源就是AI。各行各业正在应对可持续发展、生成式AI和数字化等强大的动态挑战，因此加速计算和AI的到来恰逢其时。

　　黄仁勋表示，在过去十年中，加速和纵向拓展的结合，使我们能够为许多应用实现百万倍性能提升，进而有助于解决以前无法解决的问题。虽然存在很多示例，但最著名的一个是深度学习。

　　“加速计算并非易事，2012年，计算机视觉模型AlexNet动用了GeForce GTX 580，每秒可处理262 PetaFLOPS。该模型引发了AI技术的爆炸。”“十年之后，Transformer出现了，GPT-3动用了323 ZettaFLOPS的算力，是AlexNet的100万倍，创造了ChatGPT这个震惊全世界的AI。崭新的计算平台出现了，AI的‘iPhone时刻’已经来临。”

　　为ChatGPT提速10倍！

　　在黄仁勋的主题演讲中发布了全新的GPU推理平台。

　　该平台包括4种不同配置，针对不同工作负载进行优化，分别对应了AI视频加速、图像生成加速、大型语言模型（LLM）加速和推荐系统和LLM数据库。包括：L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超级芯片。

　　据悉，H100 NVL是专门为LLM设计的GPU，采用了Transformer加速解决方案，可用于处理ChatGPT。

　　“当前唯一可以实际处理ChatGPT的GPU是英伟达HGX A100。与前者相比，现在一台搭载四对H100和双NVLINK的标准服务器速度能快10倍，可以将大语言模型的处理成本降低一个数量级。”

　　另外，英伟达最新确认，H100 NVL预计将在今年下半年上市。

　　另外，L4是针对AI生成视频的通用GPU，用于加速AI视频，可以提供比CPU高120倍的性能，能效提升约99%。

　　L40则是用于图像生成，针对2D、3D图像生成进行优化，并可以结合Omniverse，直接生成3D内容，甚至是元宇宙内容。其性能是英伟达最受欢迎的云推理GPU T4的10倍。

　　Grace Hopper超级芯片则是为推荐系统和大型语言模型AI数据库设计的。可用于图推荐模型、向量数据库和图神经网络。它可以通过900GB/s的高速一致性芯片到芯片接口连接英伟达Grace CPU和Hopper GPU。

　　还有这些重磅产品

　　除此之外，在GTC大会上，英伟达还发布了AI超级计算服务DGX Cloud、突破性的光刻计算库cuLitho、云服务NVIDIA AI Foundations等，以及与Quantum Machines合作推出了全球首个GPU加速量子计算系统。

　　其中，DGX Cloud提供了专用的 NVIDIA DGX AI超级计算集群，用户能够按月租用这些计算资源，并使用简单的网络浏览器访问。从而消除在本地获取、部署和管理基础设施的成本，大大增加了AI的便捷性。

　　该服务目前已经与Microsoft Azure、Google GCP和Oracle OCI开展合作。每个DGX Cloud实例都具有八个H100或A100 80GB Tensor Core GPU，每个节点共有640GB GPU内存。

　　另外，发布的光刻计算库cuLitho可将计算光刻加速40倍以上。

　　“计算光刻是芯片设计和制造领域中最大的计算工作负载，每年消耗数百亿CPU小时。大型数据中心24x7全天候运行，以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。”

　　据悉，全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。该计划旨在加快制造光掩模的任务，光掩模是塑造光投射到硅晶片上以制造电路的方式的屏幕。

　　最新发布的全新云服务及代工厂NVIDIA AI Foundations包括语言、视觉和生物学模型制作服务。

　　另外，英伟达还推出了量子计算。英伟达与Quantum Machines合作推出了一个量子控制链路。它可将英伟达GPU连接到量子计算机，以极快的速度进行纠错。据悉，NVIDIA DGX Quantum是全球首个GPU加速的量子计算系统，可以实现GPU和量子处理单元（QPU）之间的亚微秒级延迟。

<<实体企业“催生”中国ChatGPT｜张文涛｜人工智能｜文心

Microsoft 365 copilot推出，GPT全方位赋能Office套件，效果震撼3月16日，微软在线上>>

为ChatGPT提速10倍！英伟达放大招：AI的“iPhone 时刻”已来

您可能还会对下面的文章感兴趣：

随便看看