cha

智能治理||王国成:ChatGPT的言传与意会

  原标题:智能治理||王国成:ChatGPT的言传与意会

  编者按

  2022年11月以来,美国人工智能研究公司OpenAI开发的聊天机器人ChatGPT,迅速成为史上增长最快的消费级应用程序,引发广泛关注。ChatGPT的出现成为人工智能发展的引爆点,推动各国科技创新竞争进入新赛道。技术的跨越必然带来应用场景中的深入观察,无论人工智能服务变得多聪明,适应与满足人类发展需要始終是根本指向。面向未来,多维度多视域探讨 ChatGPT对人的生产方式、生活方式、思维方式、行为模式、价值观念以及对产业革命和学术研究等的重要影响,有助于我们正确使用和管理这种技术,进而思考人工智能的发展前景。

  智能治理||王国成:ChatGPT的言传与意会(图1)

  王国成:ChatGPT的言传与意会

  ChatGPT自2022年11月问世以来,大大超出人类写作的平均水平预期,迅速火爆升温,注册用户上亿,引发谷歌、百度等数千亿产业投资,无疑是AIGC(人工智能生成内容)和NLP(自然语言处理)领域的一大进步。但是从某种意义上说,其价值取向、服务目的、技术进步、推广应用和发展规划等尚极其受限,需要深度思考。

  技术突破

  ChatGPT的基本原理与核心技术,是基于统计方法的监督式深度(强化)机器学习,属于AIGC和NLP领域,无论是技术上还是应用上都极具潜力,被Science杂志评选为2022年度十大科学突破之一。ChatGPT的出现,使AIGC强化了内容与生产力的连接,大大推进了NLP的研究进展。

  推进NLP的技术转向和研究范式的变革。ChatGPT迅速走红,其实是自回归类语言模型的一次翻身仗。近年来,NLP领域对Transformer思想产生的大型预训练模型,从双向语言模型对自然语言的理解,到以自回归语言模型(按语序),更多地应用于自然语言生成任务,ChatGPT的强大能力让自回归语言模型一样能达到甚至赶超双向语言模型,甚至在未来有可能实现统一理解、生成两类任务。

  实现LLM(Large Language Model,大型语言模型)交互接口的革新。ChatGPT的最大贡献是几乎实现了理想的LLM交互接口,让LLM适配人的习惯命令表达方式,而不是反过来让人去适配LLM,从而提升了易用性和用户体验。这必将启发后续的LLM模型在易用人机接口方面做进一步的工作,让LLM更听话,使LLM技术体系囊括NLP外的更多领域。ChatGPT最突出的特点是“能力强大,善解人意”。巨量语料、算力的结晶,使模型蕴含的知识几乎覆盖了各个领域;其训练过程中加入了“人类偏好”的人工标注数据,能够理解人的命令,表露出一些“人味”。

  强化Transformer整体功能。相比较而言,ChatGPT是应用功能增强型的,而元宇宙是整体建构型的。ChatGPT的核心技术和关键支撑,是由最后一个字母T(即Transformer)的基本含义和主要功能强化连接、传输、转换和调适等来体现的,借此可跨域跨科、适应于不同应用主体和设施。于是,人类语言覆盖的所有领域,都有可能放在同一平台上进行信息和数据的自动化智能化处理。

  投入成本巨大。目前,ChatGPT应用的RLHF技术(基于人类反馈的强化学习),需要拥有3000亿以上单词的语料基础、1750亿个参数的模型;若要训练图形保证误差率在5%以下,就需要1000亿美元左右的投入。这说明AIGC类技术的进展艰难、缓慢,且成本巨大。类似的Google LaMDA、Bard、YouChat和Perplexity AI等,机器与人对话或文本、或语音,间或附以图景画面等形式,都只是多“能”而少“智”,虽然在提高规模、速度、效率和精准的功能方面有显著进步,但在与人类互激共进方面还很“Low”,远不如人意。

  应用空间

  引发投资、产业和市场应用。对大多资本与科技巨头来说,密切关注和入局ChatGPT赛道,无疑是看中了技术背后的市场空间,如在跨境电商、游戏开发、企业管理、数字化转型和教育等领域,以及现代高科技生活方式方面的应用。以生成式问答为主体,结合现有的NLP、个性化搜索引擎和知识图谱等,综合考虑用户个性化需求和购物特点与习惯的提示词标注、知识结构等进行应对用户问题的内容生成和展示,可以在技术上实现完整一致的搜索体验。

  促进数智治理和数字政府建设转型。ChatGPT无疑能强有力地推动政府部门运用各类数字技术促进经济调节、社会管理和公共服务等职能环节实现数字化转型。例如,将ChatGPT用于公共服务体系建设,有助于关切微观主体,全方位获取用户的需求和偏好,提升公共政策的执行效率;提供决策相关的各类数据,获得多种可供选择的政策方案,加速推进政府决策的智能化和科学化;公务员从繁重的文稿准备工作中解放出来,加强信息搜索和文书加工合成能力。

  助力人文社会科学研究。对学术研究领域,ChatGPT无疑是很好的“助手”,它能整合和输出既有文本、辅助创新和生成新的观点与想法。有效利用ChatGPT超强的数据挖掘/爬虫/获取和文本分析处理能力,收集更多以前无法获得的数据,有望突破现有学科壁垒,对跨学科交叉融合、新文科等新学科建设起着重要的助推作用。

  辅助改善日常生活。在日常生活中使用ChatGPT可加快完成常规任务,减少重复性劳动,提升生活质量;检测网络设备的安全漏洞隐患,增强系统安全性;加快物智互联和物流效率,加强实时控制管理;实时监测和评估人们的身体状况,及时提供改善和保障健康建议;普及数字知识、技能和应用,充分利用大数据与人工智能技术提高生活便利和幸福感。然而,ChatGPT也会引发社会规则演变和科技伦理方面以及收入分配和公平问题,需要及时防范。

  发展前景

  目前,ChatGPT还是定位在语言处理的言传,对类意会式表达还不能结合语境进行全面的语义分解和选定。在很多条件下,人类的交流却只可意会、不可言传,尽管ChatGPT也涉足诗歌、书法和绘画,但对人的眼神、表情、手势和肢体语言,借景寓意、图形可视化可编辑、情景动画创作等领域,还基本上无能为力,要逐步完成言传—图景—意会的“三级跳”才行。

  基于有监督的深度(增强型)机器学习,ChatGPT已经成为NLP的重要一环和新的突破,并将对NLP领域产生重大影响。它能更准确地预测文本序列的概率,根据上下文内容意境自动生成文本,为NLP研究带来更多机会和提供更多便利;构建更复杂的NLP系统,从而逐步完成语言、图景和意会不同层次阶段的多向连通和无损转换的自动化、智能化处理。

  总的来看,人类与机器的分工与边界还是比较明确的。我们既要看到ChatGPT的省时省工高效,还要看到它依然停留在规定动作,基于统计平均得出的共性尚难以刻画和满足个性化需求,在人类智慧和创造性方面更乏善可陈。所以,不必担心ChatGPT会对人类工作的大量替代,它只是处在辅助和在某些方面并行的地步。

  纪伯伦说,思想是天空中的鸟,在语言的笼里,也许会展翼,却不会飞翔。ChatGPT乘风而来、倏然而至,本质上乃是人类探索和追逐AI新技术应用的脚步从未停歇。唯有突破原理认知、相关技术和算力成本约束等,ChatGPT的言传或可实现属人的意会,激发智慧,创造美好的未来。这应该是AI等未来发展的重要方向和科技向善之路。

  作者王国成系中国社会科学院数量经济与技术经济研究所研究员、中国社会科学院大学计算社会科学研究中心主任。来源:中国社会科学报2023-03-06

  肖峰:何种生成?能否创造?——ChatGPT的附魅与祛魅

  ChatGPT作为生成式人工智能(Generative AI)的新成果,显示出不同于分析式人工智能的若干新功能。它不像后者那样只能分析已存在的信息和数据,演绎(推算)出前提中已包含的结论,而是可以对既有的数据信息进行归纳概括,形成与既成东西并不相同的新东西。比如,生成对某一问题的回答从而成为聊天高手,生成人所需要的文案(如计划书、摘要、论文等)或艺术作品(如绘画、作曲、小说、诗歌等)从而成为写作或创作助手,生成计算机程序代码从而成为编程能手……凡此种种,它正在不断成为“知识生产”甚至“创造性工作”的新载体,以至于被视为横空出世的“新物种”。

  可以说,ChatGPT的这些新功能都与生成相关,呈现了“智能的生成性”这一重要特征。正是这一特征带来的变化,使得ChatGPT增添了许多新的功能,又加之它可以离常人的使用如此之近,为普通人体验其功能提供了切身感受。所以,其影响力一下子就达到了“现象级”,对其“新奇感”也极易延展为“神奇感”,从而对其附魅越来越多的神秘性。

  其实,ChatGPT的生成功能根源于机器学习算法,迄今的生成式人工智能都基于这种算法,是经验主义或归纳逻辑的认识论原则在算法理论中的体现。不同于分析式的符号AI所遵循的是从一般到个别的推理原则,生成式人工智能是从个别中归纳出一般,从大量的数据训练中形成模型,然后用这种模型去“指导”对新的个别的认识。比如,它可以根据某一诗人的诗词归纳出一定的算法规则,然后自动进行模仿该诗人风格的诗词创作。生成式人工智能的这一功能,可以说在ChatGPT中得到了充分发挥。因为训练它的数据集发生了几何级数的增加,由此成为一种归纳面更宽、归纳力更强的智能机器,所以才显示出如此之多的神奇之处。

  当ChatGPT以生成的方式进行信息处理时,确实显示出以分析的方式处理信息时的不同效用。然而,是否一旦具有生成功能,人工智能就可以威力无穷?并非如此。 其一,生成有生成的长处,分析也有分析的长处。两者在人类智能活动中是互补的,在人工智能中也是如此。所以,分析式的符号AI和生成式的人工神经网络AI也是互补的。 其二,即使是生成,也要进一步看是“何种生成”。就智能的生成性来说,也是多方面和多层次的。如果将ChatGPT的生成性与人类智能的生成性相比,它还只是一种初级的生成性,较人类智能的生成性还有相当大的距离,尤其还不能实现后者的创造性生成。

  从严格意义上看,ChatGPT的生成只是信息的生成而非知识的生成

  01

  哲学界一般认为,知识是“被验证的真信念”。ChatGPT所生成的东西,既未被验证,也不一定为真。事实上,它常常会输出错误的答案,生成一些“一本正经的胡说”。这恰恰是归纳或综合式思维的“不确定”造成的,也是在大数据训练时由于数据的差异性所带来的。它不像分析式人工智能那样基于演绎推算在输出结果上具有唯一性,而是会因归纳和综合材料的变化而使生成结论也发生变化。当归纳或综合了错误的歪曲性的信息时,就会生成“扭曲事实”的错误结论。所以,至少在目前的水平上,ChatGPT所做的“工作”只能算是“信息的加工”,所生成的是“新信息”而非可靠的“真知识”,更不是具有原创性的新的“一阶知识”,顶多能生成基于机器编辑的“二阶知识”。在这个意义上,称ChatGPT带来了“知识生产方式的革命”,还言之过早或言过其实。或许,将其视为在辅助、驱动或启发人的知识生成上又前行了一步更为恰当。

  ChatGPT的生成是一种“从有到有”的生成,即一种“有”生成另一种“有”,而非“无中生有”的生成

  02

  智能领域最重要的生成,是无中生有的生成(如提出前所未有的新看法、新思想)。ChatGPT的生成,是将“既有”的东西经过浓缩或转译后生成为另一种有(如文档),无非是“既有”的改头换面,这是只具备初级智能就可以完成的任务。而人则不然,在少信息甚至无信息的情况下,人类智能也能生成有,形成全新的信息或知识。这才是“质变”性生成,真正的“创造性生成”。ChatGPT的生成性还远未达及这种水平,它的从有到有的生成,说到底不超出“已知”的范围。其信息处理的结果,并未输出未经输入的东西,而只能根据所收到的输入内容生成文本回应。所以,ChatGPT的生成是关于“知道”的生成,所生成的东西也是人类已知的。它能够以时间压缩的方式,帮助人们快速达到以前通常要耗时很久才能通过查阅资料而达成的“知道”,但它不能像人那样生成先前完全不知道的东西。除了知道的生成外,人还有不知道的生成,即知道自己不知道什么,所以才有发现和发明的新方向,才有从不知道到知道的生成。另外,ChatGPT虽然能回答人的问题,但不能提出问题,尤其是不能提出人类不曾提出过的前所未有的新问题,而人类智能则具有在提问上“无中生有”的能力。进一步,人还能“有中生无”地“反向生成”,那就是否定既有的知识、观点及其根据,彻底推翻已有的结论,实现某种程度上的信息归零,此即人类智能所具有的“批判”“质疑”等宝贵特征,而ChatGPT还不具有这种功能。

  ChatGPT的生成是“照章办事”的生成,而非“不知道怎么办”时调用的能力

  03

  一方面,ChatGPT是通过广义的统计过程(包括贝叶斯过程)来完成归纳从而生成内容,是一个按部就班的理性计算过程。而人类的知识生成(如科学理论的发现过程)则充满了灵感、顿悟等非理性过程。 另一方面,ChatGPT中的生成是既有训练数据集和算法所规定好了的生成,某种意义上也是封闭在训练系统中的生成。它具有短时间内将大型语言模型的数据集中的相关信息“一览无余”的能力,如果能够接入互联网自己寻找学习语料,或许还具有将实时在线数据“一网打尽”的能力,呈现出归纳资源极为宽广的优势。不过,对于训练数据集或网络之外的信息,它则一无所知,从而无法回答训练数据集之外的问题,不像人类智能更多是在面对新情况、新问题时发挥作用,在没有现成方法或参照可循时也可以“眉头一皱计上心来”,显示出智能是一种在不知道怎么办时动用的东西。ChatGPT显然还不具备这种能力。在这个意义上,生成式人工智能还不能像人类智能那样可以应对“意料之外”的情况,所以并不具备有创造性的生成能力。换一种表述也可以说,ChatGPT所做的是“传承式”的生成,而非“突破式”的生成。

  第ChatGPT生成能力的增强,并未从根本上动摇人机之间的主客关系

  04

  但即便如此,ChatGPT的意义也是不容忽视的。比如,它是人工智能中自然语言处理的一种进步,也是搜索引擎的升级换代,是一种功能更强大的智能辅助工具,甚至可视为人类进入“AIGC时代”的标志。它将机器思维的长处发挥得更透彻,借助它可形成人与机器之间协同式、互联式的知识生产,造就混合智能或脑机互惠的新形态,由此进入人机分工的新阶段:由智能系统更多更高效地完成工具性的智能工作,人类则能够更充分地发挥自己作为主体的作用,即向技术系统提出任务、设定目标、启动其运行并享受其带来的成果。在这个意义上,“ChatGPT恐惧”和“ChatGPT崇拜”一样,都是不必要的。

  鉴于此,一方面ChatGPT确实因为对机器智能生成性的新开发新应用,展现了新的功能甚至新的神奇;另一方面也要看到,这种生成仅仅是智能模拟的初级功能,还不是真正“知识创新”意义上的知识生成,所以需要以平常心看待它的意义,需要在ChatGPT的附魅热潮中加以必要的“祛魅”。

  作者肖峰系上海大学哲学系教授。来源:中国社会科学报2023-03-06

  ChatGPT将取代重复劳动者,要学会数字化生存

  近日,由人工智能实验室OpenAI发布的对话式大型语言模型ChatGPT在各行各业都引发热议,并且引起了各路资本的重视。ChatGPT将对行业将带去哪些影响?人口红利和工程师红利效应是否会被削弱?发达国家和发展中国家之间的距离是否会拉大?对此,搜狐智库对话了盘古智库高级研究员江瀚。“我们一直在说科技发展是一把双刃剑,人工智能给一个企业所带来的加速度,有可能是我们完全难以想象得到的,也许会有更多的岗位被市场所取代。”江瀚表示,对于当前的整个市场来说,人工智能彻底改变我们日常生活的可能性已经出现,如果一个AI大规模商业化的时代到来,将会在整个市场上带来一次巨大的变革,这种变革产生的结果往往是不可预知的。

  后发国家是否还具备崛起优势?江瀚说要更多的看这个优势是什么,如果是制造业的话,其实想要用人工智能彻底取代制造业,目前来看还是不现实的,但是如果是以软件业为核心的、以互联网为依托的后发国家,则很有可能会遭到AI的降维打击。对于全球市场而言,人工智能都是一个巨大的风口。江瀚认为这个风口的核心在于企业需要海量的资源进行投入,并不是任何一个企业想做人工智能就可以做好的,需要很多的市场的布局,需要大量的准备和大量的技术研发投入。“这就是与其说市场无法对抗,‘打不过,为什么不加入呢?’让ChatGPT成为我们的一部分或者成为我们工作的助手,无疑对我们更加有利。要真正学会什么叫数字化生存,真正让自己成为那种不可被替代的、具有创新能力和独特性的存在,只有这样才有可能在市场上真正生存。” 江瀚说。

  智能治理||王国成:ChatGPT的言传与意会(图2)

  ChatGPT算力消耗惊人,能烧得起的中国公司寥寥无几

  高性能GPU数量或性能不够的结果是,AI推理和模型训练的准确度不足,即使做出类似的对话机器人,机器人的“智商”也会远低于ChatGPT

  文 | 吴俊宇

  国内云厂商高性能GPU芯片缺货,正在成为限制中国生成式AI诞生的最直接因素。2022年12月,微软投资的AI创业公司OpenAI推出了聊天机器人ChatGPT。这是生成式AI在文本领域的实际应用。所谓生成式AI,是指依靠AI大模型和AI算力训练生成内容。ChatGPT本质是OpenAI自主研发的GPT-3.5语言大模型。该大模型包含近1800亿个参数。

  微软的Azure云服务为ChatGPT构建了超过1万枚英伟达A100 GPU芯片的AI计算集群。美国市场研究机构TrendForce 在3月1日的报告中测算称, 处理1800亿个参数的GPT-3.5大模型,需要的GPU芯片数量高达2万枚。 未来GPT大模型商业化所需的GPU 芯片数量甚至超过3万枚。更早前的2022 年11 月,英伟达在官网公告中提到,微软Azure上部署了数万枚A100/H100 高性能芯片。这是第一个采用英伟达高端GPU构建的大规模AI算力集群。鉴于英伟达在高性能GPU方面的技术领先实力,在国内,云计算技术人士公认的一个说法是,1万枚英伟达A100芯片是做好AI大模型的算力门槛。

  《财经十一人》了解到,目前国内云厂商拥有的GPU主要是英伟达中低性能产品(如英伟达A10)。拥有超过1万枚GPU的企业不超过5家,其中拥有1万枚英伟达A100芯片的企业最多只有1家。也就是说,单是从算力这个衡量指标来看,国内能在短期内布局类似ChatGPT的选手十分有限。ChatGPT看似只是聊天机器人,但这却是微软的AI算力、AI大模型和生成式AI在消费市场的一次肌肉展示。在企业市场,这是云计算的新一轮增长点。微软Azure ML(深度学习服务)已有200多家客户,包括制药公司拜耳、审计公司毕马威。Azure ML连续四个季度收入增长超过100%。 这是微软云旗下云、软件、AI三大业务中增长最快的板块。

  今年2月,包括阿里、百度等中国企业宣布将研发类ChatGPT产品,或将投入生成式AI的研发。在国内,AI算力、AI大模型和生成式AI被认为只有云厂商才有资格下场。华为、阿里、腾讯、字节跳动、百度都有云业务,理论上有跑通AI算力、AI大模型和生成式AI应用的入场券。有入场券不代表能跑到终点。这需要长期高成本投入。GPU芯片价格公开,算力成本容易衡量。大模型需要数据采集、人工标注、模型训练,这些软性成本难以简单计算。生成式AI的投资规模通常高达百亿元。多位云计算厂商技术人士、服务器厂商人士对《财经十一人》表示,高性能GPU芯片短缺,硬件采购成本、运营成本高昂,国内市场中短期商业化困难,这三个问题才是真正的挑战。他个人认为, 具备资金储备、战略意志和实际能力的企业,暂时不会超过3家。

  芯片数量决定“智商”

  决定AI大模型“智商”的核心因素是三个,算力规模、算法模型的精巧度、数据的质量和数量。AI大模型的推理、训练高度依赖英伟达的GPU芯片。缺少芯片会导致算力不足。算力不足意味着无法处理庞大的模型和数据量。最终的结果是,AI存在智商差距。3月5日,第十四届全国人民代表大会第一次会议开幕式结束后,科技部部长王志刚在全国两会“部长通道”接受媒体采访时评价,ChatGPT作为一个大模型,有效结合了大数据、大算力、强算法。它的计算方法有进步,特别是在保证算法的实时性与算法质量的有效性上。“就像发动机,大家都能做出发动机,但质量是有不同的。踢足球都是盘带、射门,但是要做到梅西那么好也不容易。”英伟达是全球知名的半导体厂商,在数据中心GPU市场占据超过90%以上的份额。英伟达A100芯片2020年上市,专用于自动驾驶、高端制造、医疗制药等AI推理或训练场景。2022年英伟达推出了性能更强的新一代产品H100。A100/H100是目前性能最强的数据中心专用GPU,市面上几乎没有可规模替代的方案。包括特斯拉、Facebook在内的企业,都利用A100芯片组建了AI计算集群,采购规模均超过7000枚。

  多位云计算技术人士对《财经十一人》表示,运行ChatGPT至少需要1万枚英伟达的A100芯片。然而, GPU芯片持有量超过1万枚的企业不超过5家。其中,拥有1万枚英伟达A100GPU的企业至多只有1家。另有某大型服务器厂商人士对《财经十一人》表示,即使乐观估计,GPU储备规模最大的企业也不超过5万枚,且以英伟达中低端数据中心芯片(如英伟达A10)为主。这些GPU芯片分散在不同数据中心中,单个数据中心通常只配备了数千枚GPU芯片。

  此外,由于美国政府去年8月开始实施的贸易限制,中国企业早已无法获取英伟达A100芯片。现有A100芯片储备均是存货,剩余使用寿命约为4年-6年。2022年8月31日,英伟达、AMD两家半导体企业旗下生产的GPU产品被美国列入限制范围。英伟达被限制的产品包括A100和H100,AMD受管制GPU产品包括MI250。按照美国政府的要求,未来峰值性能等于或超过A100的GPU产品也被限制出售。(详情见《财经十一人》2022年9月1日报道《 美国限制高性能GPU供应,倒逼中国自主化 》 )

  智能治理||王国成:ChatGPT的言传与意会(图3)

  中国企业目前能够获取的最佳替代品,是英伟达的A800芯片。A800被视为是A100的“阉割版”。 2022 年8月,A100 被禁止销售中国市场后,英伟达在当年三季度针对中国市场推出了特供的A800 芯片。该产品计算性能与A100 基本相同,但数据传输速度被降低了30% 。这会直接影响AI集群的训练速度和效果。

  成本高昂

  AI算力和大模型是比云还要烧钱的吞金兽。即使有足量的高性能GPU,中国云厂商接下来还要面临高昂的硬件采购成本、模型训练成本以及日常运营成本。面对上述成本,具备资金储备、战略选择和实际能力的企业不超过三家。OpenAI能做出ChatGPT,背后有微软提供资金和算力。2019 年微软向OpenAI投资10 亿美元。2021 年微软再进行了一轮未透露金额的投资。今年1月,微软宣布将在未来数年陆续向OpenAI投资100亿美元。 对云厂商来说,AI算力和大模型需要面临高昂的硬件采购成本、模型训练成本以及日常运营成本。

  其一,硬件采购成本和智算集群建设成本。如果以1万枚英伟达A800 GPU为标准构建智能算力集群,在10 万元/枚的价格标准下,仅GPU采购成本就高达10亿元。 一台服务器通常需要4枚-8枚GPU,一台 搭载A800的 服务器成本超过40万元。国内服务器均价为4万-5万元。一台GPU服务器的成本是普通服务器的10倍以上。服务器采购成本通常是数据中心建设成本的30% ,一个智算集群的建设成本超过30亿元。

  其二,模型训练成本。想要算法模型足够精准,需要进行多轮算法模型训练。有某外资云厂商的资深技术人士对《财经十一人》表示,ChatGPT 一次完整的模型训练成本超过1200万美元(约合8000 万元)。如果进行10 次完整的模型训练,成本便高达8亿元。GPU芯片价格公开,算力成本相对容易衡量。但AI大模型还需要数据采集、人工标注、模型训练等一系列工作,这些软性成本难以简单计算。不同效果的模型最终成本也不同。

  其三,日常运营成本。数据中心内的模型训练需要消耗网络带宽、电力资源。此外,模型训练还需要算法工程师负责调教。上述成本也以亿元为单位计算。也就是说,进入AI算力和AI大模型的赛道,前期硬件采购、集群建设成本就高达数十亿元。后期模型训练、日常运营以及产品研发成本同样高达数十亿元。一家管理咨询公司技术战略合伙人对《财经十一人》表示,生成式AI的投资规模高达百亿元。

  微软大规模采购GPU组建智算集群,这在商业逻辑上行得通。2022年微软在云计算基础设施的支出超过250亿美元 ,当年微软营业利润828亿美元,微软云营业利润就超过400亿美元。仅微软云利润大于支出,大规模投资AI算力、大模型业务,这与微软的财务现状是相匹配的。微软的AI计算有产品、有客户、有收入,形成了新的增长点。微软的客户通常会在云上租赁数千枚高性能GPU,进行语言模型学习,以此使用自己的启用生成式 AI。微软旗下包括Azure ML和OpenAI。Azure ML有200多家客户,包括制药公司拜耳、审计公司毕马威。Azure ML连续四个季度收入增长超过100%。微软云甚至已经形成了“云-企业软件-AI计算”三条轮动增长的曲线。其中公有云Azure营收增速约为30%-40%,软件业务营收增速约为50%-60%,AI算力营收增速超过100%。

  中国企业用于云基础设施的资本支出有限,投资投资智算集群、AI大模型需要从有限的预算中分走支出。更大的挑战是,中短期内不仅无法盈利,还要亏更多钱。科技公司的资本支出通常被用于采购服务器、建设数据中心、购置园区土地等固定资产。以亚马逊为例,2022年资本支出580亿美元,超过50%用于投资云基础设施。《财经十一人》查阅阿里、腾讯、百度最近一个财年的资本支出发现,三家数据分别为533亿元、622亿元、112亿元。三家均未披露用于投资云基础设施的资本支出情况。假设三家企业与亚马逊相同,50%的资本支出用于投资云基础设施,数据分别为266亿元、311亿元、56亿元。投资数十亿元对资本支出宽裕的企业来说可以承受,但对资本支出不足的企业来说,则是负担。国内宣布已建设智算集群的企业包括阿里云、华为、百度,但智算集群内GPU芯片数量不详。2022年,主要云厂商均把提高毛利、减少亏损作为战略重点。在这个阶段采购高性能GPU、建设智算集群需要巨额投入。不仅会加剧亏损,还需要依赖集团输血。这将考验企业管理层的战略意志。

  大模型没条件,先做小模型

  华为、阿里、腾讯、字节跳动、百度都有云业务,理论上有做出中国版ChatGPT的入场券。有云计算技术人士评价,有入场券的几家企业也会有实际的战略考量。比如,腾讯、百度、字节跳动有云也有大量数据,但云业务在亏损,长期投入的资金储备、战略意志存疑。华为靠自研昇腾芯片建立了大模型技术,但因“断供”影响无法获得英伟达的GPU芯片,而且作为硬件厂商缺少互联网公司的数据积累。由于上述限制,能实现AI大模型商业化的企业少之又少。最终同时具备资金储备、战略意志和实际能力的企业将聊聊无几。目前,没有一家中国云厂商像微软一样拥有数万枚A100/H100芯片。中国云厂商的高性能GPU算力目前暂时不足。一种更务实的观点是,中国云厂商即使真的获取1万枚英伟达高性能GPU后,也不应该简单投入到中国版ChatGPT这种大众的消费场景。算力资源稀缺时,优先考虑是投入行业市场,为企业客户提供服务。一家管理咨询公司技术战略合伙人 对《财经十一人》表示,ChatGPT只是对话机器人,商业应用场景展示暂时有限。用户规模越大,成本也就越高,带来的亏损也会越大。AI算力和大模型如何在细分领域实现商业化,获取正向现金流才是关键。中国市场的AI算力、大模型的商业化尚处于起步期。目前国内自动驾驶、金融等领域的少数客户开始采用AI算力。比如,小鹏汽车目前已经采用阿里云的智算中心进行自动驾驶的模型训练。有数据中心产品经理对《财经十一人》表示,国内银行金融客户反欺诈已经大量运用模型训练技术,通常只需要租赁使用数百枚性能更低的GPU调教模型。同样是AI计算和模型训练,这是更低成本的解决方案。事实上,通用大模型无法解决行业具体问题,无论是金融、汽车、消费等各个领域都需要行业模型。中国暂时没有足够的高性能GPU做大规模AI模型训练,可以先在细分领域做小模型。AI技术发展之快速超越了人们的认知,对中国公司来说,持续布局战略性发力才是根本之道。

  《南方治理评论》稿约

  《南方治理评论》始创于2013年,CNKI来源集刊。广州大学南方治理研究院主办、社会科学文献出版社出版的连续性学术辑刊。《南方治理评论》秉持“培育公共精神,直面转型中国,诠释社会热点,扩展学术深度,贴近重大需求,服务国家治理”,追求“本土化、专业化、个性化、国际化”,崇尚原创研究、微观研究和深度研究的学术精神,试图在中国繁杂的地方语境下运用本土话语体系着力解读地方性知识和日常性逻辑。主要设置有“学术一线”、“数字治理”、“健康治理”、“灾害治理”、“南国讲堂”、“伶仃书评”、“回归访谈”等栏目。

  通讯地址:广州市大学城外环西路230号文逸楼512室

  投稿邮箱:gdgzpar@163.com

  投稿网站:http://iedol.ssap.cm.cn/(选择“社会政法”)

  投稿体例:https://pan.wps.cn/l/srr2hdj

  《南方治理评论》第8辑

  《南方治理评论》第7辑

  《广州公共管理评论》第6辑

  《广州公共管理评论》第5辑

  《广州公共管理评论》第4辑

  《广州公共管理评论》第3辑

  《广州公共管理评论》第2辑

  《广州公共管理评论》第1辑

  广州大学南方治理研究院始创于2019年,广东省高校特色新型智库,广东省决策咨询研究基地。研究院主要研究领域包括珠三角政府治理、粤港澳大湾区社会治理、珠江流域生态治理、泛珠三角健康治理、南中国海安全治理等五大方面,致力于建设成为“经世致用、咨政育人”的地方高校特色智库。

  广州大学南方治理研究院

  责任编辑:


您可能还会对下面的文章感兴趣:

登录 注册 退出