cha

ChatGPT引爆算力需求!中国企业能否招架?

  作为人工智能三大核心要素之一,算力也被誉为人工智能“发动机”。数据显示,ChatGPT的总算力消耗约为3640PF-days(即假如每秒计算一千万亿次,需要计算3640天),需要7~8个投资规模30亿、算力500P的数据中心才能支撑运行。

  行业专家表示,人工智能的算力大概需要百倍甚至千倍现有算力的支持。就ChatGPT而言,需要TB级的运算训练库,甚至是P-Flops级的算力。就目前的服务器处理能力来看,大概是几十到几百台GPU级别的服务器的体量才能够实现,而且需要几日甚至几十日的训练,它的算力需求是非常惊人的。

  而与需求相对应的是,我国智能算力规模保持快速增长。IDC报告显示,2022年人工智能算力规模达到每秒268百亿亿次浮点运算,超过通用算力规模,预计未来5年中国人工智能算力规模的年复合增长率将达52.3%。

  在此背景下,随着国内厂商相继布局ChatGPT类似模型,算力需求或将持续释放,AI服务器、AI算力芯片等供给端核心环节或将率先受益。那对于承接ChatGPT引爆的算力需求,这些企业正在进行哪些布局?

  浪潮信息:已推出用于国产ChatGPT的AI算力产品

  面对ChatGPT带来的庞大算力需求,全球AI服务器龙头浪潮信息在投资平台表示,公司在人工智能服务器领域的市占率位居全球AI服务器市场第一,中国市场份额已连续五年保持50%以上,可充分满足相关AI产品对于内容生成的全流程的计算能力需求。同时,在AIGC赛道,浪潮信息已在底层计算能力、中间层大模型算法能力和上层行业应用方面进行布局,未来将会持续发布AIGC的支撑产品。

  据了解,浪潮信息2021年发布的源1.0大模型是面向中文的超大规模预训练自然语言模型,模型结构与GPT-3类似,与GPT-3相比,参数量增加40%,训练数据集提升10倍,达到了2457亿参数,训练使用了5TB的高质量中文数据。同时,浪潮信息也一直在推进大模型的行业应用落地,如“AI剧本杀”、“ 心理咨询AI陪练”、“AI反诈”、“金陵诗会”、企业”智能客服大脑”等应用。浪潮信息表示:“ChatGPT是一款非常优秀的应用产品,对我们规划设计产品也提供了非常好的借鉴。未来我们也会持续不断地发布基于源大模型的落地应用产品。”

  值得关注是,2月10日,浪潮信息已推出可用于国产ChatGPT创新的AI算力服务产品。

  曙光AI算力服务被抢注一空

  自去年11月30日推出,历时2月,ChatGPT月活量突破一亿户,成为史上增长最快的消费者应用,ChatGPT的惊人能量在中科曙光这里再次得到印证。近日,中科曙光在公众号发文表示,截止2月12日,曙光智算公司提供用于AI训练与推理计算的试用资源,在开放使用后一周内已被抢注一空,通常情况下,这些计算资源要三个月左右才能被用户注册并使用。目前,曙光智算正协调多个计算中心,提供更多算力资源满足用户需求。

  据了解,为降低AI大模型的训练与推理成本,曙光在2019年就开始布局AI算力服务,将遍布全国的海量异构计算资源链接,形成一体化算力服务网络。该算力服务网实现了对算力、存储、网络以及数据等分布资源的整合,并通过统一的算力服务门户,根据科学计算、工程计算和智能计算等场景需求,向用户输出算力、算法、数据、应用高度协同的一体化资源。让用户无需投入大量成本购买硬件设施也可完成AI大模型训练等复杂计算工作。

  除在线提供Tensorflow、PyTorch、PaddlePaddle等主流AI框架外,曙光还针对大模型的分布式训练进行持续优化,率先实现在数千节点规模时仍能满足高效训练目标。

  宁畅:以定制化服务器迎接AI算力挑战

  在IDC日前发布的GPU加速服务器市场报告中,宁畅位列中国区前二。随着ChatGPT的持续爆火,宁畅也迎来了更多市场空间和发展机会。宁畅副总裁兼CTO赵雷表示:“我们在几年前就布局了人工智能服务器赛道,目前看来是找准了时机,未来宁畅将坚定不移地做定制化市场,以用户为核心,持续发力人工智能赛道。”

  据悉,宁畅近三年时间相继推出了人工智能服务器系列产品X620 G40、X640 G40、X660 G45,今年推出基于最新平台的X620 G50,具备推理、训练等能力,覆盖机器学习、AI推理、云计算、云存储等多种应用场景。

  联想:未来将为人工智能场景提供完整的服务器矩阵

  作为重要的算力企业之一,联想致力于依托“端-边-云-网”的新算力基础架构为用户提供无处不在的普慧算力。对于ChatGPT推动的AI开发范式的转变。联想集团CTO芮勇表示,长远来看,很有可能AI新范式与旧范式共存,或是相互结合,而不会单个范式一统天下。联想将充分发挥“端-边-云-网-智”新IT架构的优势,支撑新旧范式的结合与转换。

  据介绍,联想提出的新IT架构,既致力于推动自身的智能化变革,也着眼于赋能各行各业的智能化转型。AI模型对运行环境需求越来越高,例如云-边-端的高度协同,异构计算与负载均衡、设备之间的互联互通、数据安全与隐私保护、模型本身的伸缩性与扩展性等等。联想在这些方面都有着深厚的技术积累,新IT架构将在AI新范式加速智能化变革的过程中继续发挥重要作用。同时,联想还在考虑AIGC技术在产品和业务里的应用。例如在智能设备中对跨模态的生成模型进行优化和裁剪,使之能加载到手机或平板上实现个性化内容生成。在智能解决方案方面,联想考虑把AIGC用于新产品营销与新客户触达。

  更值得关注是,2月8日,联想推出了全新的服务器品牌“联想问天”,并发布首款产品——联想问天 GB5520 V3服务器,这是联想完成普慧算力布局的关键“落子”。联想表示,问天服务器产品家族未来将为中国客户陆续带来更多丰富的多元化产品,包含机架式服务器、塔式服务器、高密度服务器、人工智能服务器、存储型服务器等,这些产品将针对通用数据中心、中小企业、高性能计算、人工智能场景提供完善的服务器矩阵。

  寒武纪:AIGC相关业务要结合终端应用情况考虑

  作为中国AI芯片的领导者,寒武纪在ChatGPT爆火后备受瞩目。近日寒武纪的工作人员表示,公司产品本身可以覆盖到人工智能领域内较多的应用,也已经搭建涵盖端、云、边三大场景的矩阵化的产品线,能够为用户提供不同场景和规模的算力产品,但AIGC等相关业务还是要结合下游终端应用的实际情况考虑。

  据了解,寒武纪较早就实现了多项技术的产品化,相继推出了云端推理思元270、边缘推理思元220、云端训练思元290以及最新发布的推训一体思元370等产品。

  昆仑芯AI芯片已被部署到搜索、自动驾驶等业务

  面对ChatGPT在AI+搜索方面发起的挑战,百度计划推出ChatGPT竞品“文心一言”,将于三月份完成内测,并面向公众开放。而作为百度智能芯片及架构部的百度昆仑芯也在近日表示,就大模型而言,昆仑芯在产品定义上已经做了布局,昆仑芯2代芯片相较第一代产品大幅优化了算力、互联和通用性,在百度内外部的大模型场景中都有切实的落地,而在研的下一代产品将提供更佳的性能体验。

  据了解,昆仑芯架构来自真实AI场景和业务需求。目前,昆仑芯已经量产了两代云端通用AI芯片,并达到数万片规模部署。在百度内部,昆仑芯AI芯片已经被部署到了搜索、小度、自动驾驶等业务,百度之外,昆仑芯也已经在金融、工业、教育等近百家客户的业务中被广泛部署和使用。

  思必驰:手握ChatGPT的进阶版语音对话机器人的先发优势

  作为国内专业的对话式人工智能平台企业,思必驰拥有全链路语音及语言交互技术,自主研发了新一代人机交互平台和人工智能芯片。面对ChatGPT的强势来袭,思必驰联合创始人俞凯表示,思必驰的语音和语义的通用基础模型已达到亿级参数。当前,思必驰正使用千块GPU卡量级的超算资源,整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

  面向未来,俞凯表示,现在的ChatGPT还是以文本机器人的形式出现,未来一定会往语音对话机器人方向去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

  在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术有很大机会。当前思必驰已在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

  小结

  虽然目前全球还没有能与ChatGPT抗衡的大模型产品,但百度、阿里、腾讯、京东等中国企业已展开类ChatGPT技术和产品的竞逐,而能否取得成功,必不可缺少浪潮信息、曙光、宁畅、联想、寒武纪、昆仑芯、思必驰等算力企业的支撑。我们或许可以预见,随着这些厂商在算力服务上持续精进,充分承接中国ChatGPT产品的算力需求,二者相辅相成,互相成就,聚力造就中国AI产业的大发展。

  作者:朱文凤

  责编/版式:沈新竹

  审核:申晴

  监制:刘启诚


您可能还会对下面的文章感兴趣:

登录 注册 退出