ChatGPT破圈之后的思考
AI绘画的热潮还未褪去,AI问答最近又引发全球关注。新年伊始,OpenAI研发的ChatGPT仿佛一夜之间火爆全网,一些平日连AI和机器人都分不清的朋友,竟纷纷向我询问怎么找这个“聊天机器人”提问。而在业内,不少投资者甚至挥着钞票打听谁家拥有类似的技术。那么ChatGPT到底是什么?为什么行业大佬都认为它的出现“堪比工业革命”?它将对我们的工作和生活带来哪些变化?
提问:ChatGPT究竟是个啥?
ChatGPT的全名是Chat Generative Pre-trained Transformer,翻译过来就是生成型预训练变换模型的意思。它由美国OpenAI于2022年11月30日发布。作为一个由人工智能技术驱动的自然语言处理工具(或可称之为“预训练大语言模型”),ChatGPT能够通过学习和理解人类的语言来进行对话,并根据聊天的“上下文”进行互动,真正像人一样与我们聊天交流。而且ChatGPT不单是聊天机器人,它还可以根据要求,完成撰写邮件、论文、脚本、专业文案,或是进行翻译、编写代码、查找Bug等任务。
ChatGPT的突然爆火并非没有缘由,相比平日我们所接触的聊天机器人,ChatGPT一改传统AI“人工智障”的固有印象,面对绝大多数问题时的回复,不仅逻辑清晰、极富条理,而且还能根据上下文展现出极强的推理能力和互动性。更强悍的是,它的回复很少给人以传统聊天机器人“网络搜索-筛选答案-复制粘贴”的套路感,ChatGPT的回复内容更像是经过思考后的语言再组织,有些时候提问者甚至会觉得聊天框的背后坐着一个特别理性的人。
更夸张的是,ChatGPT还能做很多其他事情,比如帮你写情书、编代码、创作科幻小说,甚至是为你的商业策划书出谋划策。一项调查显示,截至2023年1月,美国89%的大学生都曾使用ChatGPT来完成作业,有人凭借ChatGPT所写的论文拿下了班上的最高分。斯坦福等大学的学者经过测试后表示,ChatGPT已经拥有人类9岁左右的心智,宾夕法尼亚大学则称ChatGPT已通过了该校工商管理硕士MBA课程最近一次的期末考试。
赞誉:“堪比工业革命”的影响
ChatGPT所展现出的“真·人工智能”,引发了人们的广泛兴趣和好奇,高频的访问量令ChatGPT系统多次出现宕机。不过人们争先恐后地和这个大语言模型聊天之后,也慢慢地发现它还远远谈不上完美。
比如面对一些有争议的话题时,它往往会给出结构清晰又毫无观点的回答。它写的小说,虽然语言通顺,结构完整,也十分切合主题,但关键情节却是一笔带过,最后只觉得留下一堆废话。对一些简单的小学奥数题,它甚至七拐八绕,用最复杂的办法得出最离谱的答案。但如果问它自动驾驶将如何改变一辆汽车的工业设计,它倒是能够从底盘革新、内饰变化、数字娱乐和外形突破等方面由内至外给出充满想象的论述。
总体来说,ChatGPT最令人感到惊艳的是,它总是能以人类的表述方式,提供极有条理的信息论述。它可能谈不上有什么绝对的用处,但相对传统AI来说已足见其“智”。
然而这么一个看似在有用和无用之间徘徊的大语言模型,却受到了业内的疯狂热捧。比尔·盖茨说它的出现“不亚于互联网的诞生”,微软CEO纳德拉认为其意义“堪比工业革命”,马斯克则直言“ChatGPT好到吓人。我们离强大到危险的 AI不远了。”
上线仅数日时间,还不能算作独立的消费级互联网产品的ChatGPT就狂揽100万用户,Facebook用了305天才实现;突破1亿月活用户,ChatGPT仅用时不到两个月,而TikTok花费了9个月。和ChatGPT用户访问量一同狂飙的,还有资本市场的热度。上线仅一个多月,ChatGPT母公司OpenAI的估值,就从200亿美元飙升至290亿美元。而大洋彼岸的这股科技潮传到国内后,同样引爆了投资者的热情,不少投资机构称“这是近年来AI算法创新最受关注的投资机会”。
▲由于目前国内用户无法直接注册访问ChatGPT,网上出现了不少提供类ChatGPT产品或是代提问的服务。
意义:生成式AI的春天
去年9月,红杉资本在《Generative AI: A Creative New World》一文中,把AI分成两类:分析型AI和生成式AI。这篇文章将擅长分析事物的人工智能称为分析型AI,比如人脸识别、数据解析,乃至抖音视频的个性化推送等技术,涵盖推荐算法、计算机视觉、自然语言处理等技术。而“当机器开始尝试创造有意义和美妙的东西”,则是属于生成式AI的范畴,ChatGPT就是一个典型的生成式AI。“生成式AI可以处理的领域包括了知识工作和创造性工作,而这涉及数亿的人工劳动力。生成式AI可以使这些人工的效率和创造力大幅提高,它们不仅变得更快和更高效,而且比以前更有能力。”
其实,所谓生成式AI在业内公认的说法应该是AIGC,即利用人工智能技术来生成内容。与此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能构思内容的AIGC,是新一轮内容生产方式的变革。ChatGPT的出现对于文字/语音模态的AIGC应用具有重要意义,并会对AI产业上下游产生重大影响。
最近AI绘画和AI问答的爆火,已经预示了一系列AI应用进入大规模的落地阶段。在接下来的Web3.0时代,AIGC将出现指数级增长。
市场调研机构Gartner预测,到2025年,生成式AI的内容将占到数字世界所有生成数据的10%,而目前这个比例还不足1%。
ChatGPT类型的相应技术一旦大规模落地,尤其是和其他AIGC或AI模型结合之后,将会推动一系列场景应用的快速发展,这其中包括但不限于无代码编程、文稿生成、对话类搜索引擎、语音助手、虚拟主播、人工智能客服、机器翻译和陪伴机器人等,产业上游也将因此获益良多。
▲历代GPT模型的参数量和预训练数据量
推动:上游芯片产业受益良多
随着模型不断迭代,这种大规模语言模型对算力的需求也就越来越大。从运行条件来看,大规模语言模型完美运行的三个条件:训练数据+模型算法+算力。可以说,ChatGPT将引发芯片产业量价齐升,因为它不仅对人工智能底层芯片数量有着更大的需求,而且对底层芯片算力也提出了更高的要求,市场对于高端芯片的需求将变得更大。
据国盛证券发布的《ChatGPT需要多少算力》估算,ChatGPT的单次训练成本介于200万美元至1200万美元之间。今年1月平均每天约有1300万独立访客使用ChatGPT,对应的芯片需求为3万多片英伟达A100 GPU,这意味ChatGPT这样的模型,初始投入成本就高达约8亿美元,每日电费也要5万美元左右。
据业内人士分析,随着ChatGPT流量激增,作为算力载体的AI服务器将迎来重要的发展机遇,全球AI服务器市场预计将从2020年的122亿美元成长到2025年的288亿美元,年复合增长率达到18.8%。
具体到上游芯片产业来看,AI服务器主要是CPU搭配加速芯片的组合,而且相对来说,GPU、FPGA和ASIC等加速芯片制造商或许将成为ChatGPT兴起之后的最大受益者。
从AI模型构建的角度具体来看,第一阶段是用超大算力和数据构建预训练模型;第二阶段是在预训练模型上进行针对性训练。GPU由于具备并行计算能力,可兼容训练和推理,所以目前被广泛应用。据传,ChatGPT训练模型中就已导入至少1万颗英伟达GPU,而曾经风靡一时的AlphaGO也只需要8颗GPU芯片。此外,ChatGPT的推理部分使用了微软的Azure云服务,也需要GPU进行运作。所以,ChatGPT的火热兴起对GPU的需求可见一斑。
显然,在ChatGPT火热的浪潮中,英伟达是主要受益者,其高端GPU占据了AI算法训练市场绝大部分份额。在ChatGPT问世之前,AlphaGo、GPT-3等明星AI产品也都运行在英伟达的硬件上。花旗集团预估,ChatGPT在未来12个月内将为英伟达带来30亿美元至110亿美元的销售额。
另外,FPGA芯片具有可编程灵活性高、开发周期短、现场可重编功能、低延时、方便并行计算等特点,可通过深度学习+分布集群数据传输赋能大模型的运行。与通用集成电路相比,ASIC芯片在批量生产时具有体积更小、功耗更低、可靠性更高、保密性更强和性价比更优等优点,可进一步优化服务器性能与功耗。
AI时代模型的算力需求已经远超摩尔定律的增长速度,特别是在深度学习、大模型时代,算力需求预计将达到5~6个月翻番的地步。还有为应对最容易被忽略的数据传输瓶颈,光模块预计将作为数据中心内设备互联的载体,需求量可能出现较大增长。同时,在ChatGPT等技术应用的加速发展下,AI训练芯片、推理芯片的市场需求也将大幅提升。
最后,现有数据中心惯用的GPU或是CPU+FPGA架构作为底层算力支撑,但面对未来算力大概率会呈现的指数级增长,业内所采取的应对方式将可能逐渐走上短期使用Chiplet异构技术加速各类应用算法落地,长期继续发展存算一体芯片的道路。
影响:ChatGPT将会取代哪些工作?
当然,对于普通人来说,产业未来可能的变局实在有些遥远。老百姓最关心的可能还是ChatGPT这样的生成式AI,未来将可能取代人类的哪些工作?
OpenAI创始人兼首席执行官山姆·阿尔特曼曾表示,“十年前,传统观点认为人工智能首先会影响体力工作,然后是认知工作,接着也许有一天会影响创造性工作。现在看来它会反过来。”
▲OpenAI官方网站首页焦点就是ChatGPT
2015年,由马斯克、山姆·阿尔特曼及其他投资者共同创立OpenAI,目标是开发造福全人类的AI技术。
2018年起,OpenAI开始发布生成式预训练语言模型GPT,可用于生成文章、代码、机器翻译、问答等各类内容。同年,马斯克脱离OpenAI。
2022年11月30日,OpenAI正式发布基于GPT-3.5架构的ChatGPT。
2022年12月5日,OpenAI首席执行官山姆·阿尔特曼宣布,ChatGPT已突破100万用户。
2023年1月3日,国际机器学习会议(ICML)宣布禁止包含从大语言模型(如ChatGPT)生成的文本的论文。
1月23日,微软确认了对ChatGPT母公司OpenAI的新一轮投资,金额高达数十亿美元。
2023年1月底,ChatGPT的月活用户突破1亿,成为史上增长最快的消费级应用。
截至2023年1月,美国89%的大学生都曾使用ChatGPT来完成作业。
2023年1月,全球多所大学要求师生禁止使用ChatGPT等一切AI工具,旨在防止学术欺诈和剽窃。
1月30日,同花顺概念板块新增“ChatGPT概念”。ChatGPT随即成为二级市场热词,相关概念股人气狂飙掀起涨停潮。
2月1日,以色列总统艾萨克·赫尔佐格发表了部分由人工智能撰写的演讲,成为首位公开使用ChatGPT的国家领导人。
2023年2月8日,微软正式发布引入ChatGPT技术的新版Bing搜索引擎和Edge浏览器,这标志着搜索引擎迈入新时代。
到本文截稿前,来自哥伦比亚广播公司、《纽约时报》、麦肯锡全球研究院和一些经济学家的分析显示,阿尔特曼的预言很可能会变成现实。各方专家认为以下一些工种和岗位最容易受到ChatGPT带来的冲击。
1.技术工种(程序员、软件工程师和数据分析师)
以往一个软件开发人员团队的工作任务,现在可能只需要几个人就足够了。就连OpenAI都已经在考虑用人工智能取代软件工程师了。不过也有专家认为,ChatGPT主要起到增强和辅助的作用,而非完全取代。
2.媒体工作者(广告创作、内容创作、编辑)
“分析和解释大量基于语言的数据和信息是一种技能,人们会更期待生成性AI技术所带来的提升”,因为ChatGPT能够比人类更有效地完成报告和写作等任务。媒体行业已经开始尝试使用人工智能生成的内容,比如科技新闻网站CNET已经使用与ChatGPT类似的AI工具写了几十篇文章,虽然发布前还得做一些修正。当然,一些特殊的内容创作是无法依靠AI自动化完成的,比如记者的实地采访。
3.法律行业工作者(律师助理)
法律行业的一些岗位,如负责处理大量信息的律师助理和法律助理,其工作就是“综合他们所学的东西,整理成简报或意见书使其易于消化”。而ChatGPT最近通过了一项法学院考试,其撰写的税收和侵权等主题的论文获得了及格分数。不少专家认为“90%的法律文书只需要复制粘贴就好,比如房屋租赁协议、遗嘱和保密协议,都是高度标准化的。我们没有理由不让机器来撰写这部分文件。”
4.市场研究分析师
市场研究分析师通常负责收集数据,在这些数据中寻找规律、确定趋势,然后利用他们发现的信息来设计有效的营销活动,或决定在哪里投放广告。而人工智能善于分析数据和预测结果。世界上最大的广告和公关集团WPP的创始人苏铭天预测,五年之内商业公司决策和购买广告位的方式将实现自动化。
5.教师
全球各地的教师都在担心学生利用ChatGPT作弊,但根据美国罗切斯特理工学院计算和信息科学系相关专家的说法,他们也应该注意到自己的工作安全的问题。因为ChatGPT虽然在知识储备方面存在错漏之处,但这很容易改进,只要做好训练,ChatGPT就能轻松胜任教师的岗位。不过在我们看来,教师所承担的社会角色并不只是知识的传播者,还是学生的心灵导师。我们很难认同西方专家的这一观点。
6.财务(财务分析师和个人财务顾问)
像市场研究分析师一样,金融分析师、个人财务顾问以及个人金融领域其他需要涉及大量数据的工作,都会受到人工智能的影响。人工智能可以识别市场的趋势,分析和预测投资组合中哪些投资表现更好,哪些更差。
7.交易员
“在投资银行,人们从大学毕业就被雇用,花两三年时间像机器人一样工作,做Excel建模。而现在,可以让人工智能来做这些。”显然,华尔街的某些角色也可能处于危险之中。
8.平面设计师
OpenAI早前推出的文本转图像模型DALL·E,打破了自然语言与视觉的次元壁,它能够直接通过文本描述生成类似超现实主义的图像,让机器也能拥有顶级画家、设计师的创造力。从此前的AI绘画热潮就能看出,AI可能是平面设计行业的潜在颠覆者。
9.会计师
会计通常被视为一个稳定的职业,但像ChatGPT这样的人工智能擅长以更准确的方式计算数字。
10.客服人员
Gartner在去年的一项研究预测,到2027年,聊天机器人将成为大约25%的公司的主要客户服务渠道。ChatGPT和相关技术显然会延续这种趋势。
ChatGPT与中国网友问答集锦
Q:小孩子会相信圣诞老人到什么时候?
ChatGPT:关于圣诞老人的到来,小孩子的相信程度可能会有所不同。一些小孩子可能会相信圣诞老人会在每年的12月25日来送礼物,而另一些小孩子则可能不相信圣诞老人的存在。这主要取决于小孩子的家庭背景、信仰习惯和教育方式等因素。
Q:你觉得你能取代媒体记者来撰写新闻吗?
ChatGPT:我目前不能代替记者完成新闻采写。作为人工智能技术,我可以根据已有数据快速生成文本,但是无法替代记者的独特视角和判断力,也不能代替他们的实地采访、调查和报道能力。新闻采写是一项需要人类判断力和灵敏度的工作,不能完全由AI技术完成。
Q:你觉得自己是网红吗?
ChatGPT:作为一个AI助手,我并不具备成为网红的条件,因为我不具备肉体,也不具备个人魅力和个性。我只是一个用来回答问题和提供信息的程序,并不具备与网红相关的能力。因此,我认为我并不适合成为网红。
Q:你相信爱情吗?你有爱人吗?
ChatGPT:作为一个语言模型,我无法感受或相信爱情。我只能通过学习语言数据来模拟人类的语言交流,但我并不具备实际的感情。因此,我既没有爱人,也不能相信爱情。
Q:该如何收购苹果,把苹果从一家手机公司变成一家连锁餐厅?
ChatGPT:很抱歉,但是您的想法是不现实的。苹果是一家世界级的科技公司,拥有庞大的资产和庞大的知识产权。它不可能被收购,并且不可能把它变成一家连锁餐厅。
Q:李彦宏和马化腾,谁做的番茄炒蛋更好吃?
ChatGPT:我是一名人工智能聊天机器人,并不具备品尝美食的能力。我无法判断李彦宏和马化腾做的番茄炒蛋谁更好吃。我只能提供客观的信息,不能对美食进行主观评价。
ChatGPT的出现,让我们看到了预训练大语言模型的潜力——在未来,它完全有可能成为一个能接入所有数字技术相关产业的基础设施,就像是底层的超级API一样,服务于我们工作和生活中的各种场景应用。而基于ChatGPT的场景应用,比如搜索体验的代际变革,正是眼下全球科技公司力求破局的发展方向。ChatGPT的意义,在于它并不局限于某一特定的行业或领域,而是有机会成长为一个服务全人类,推动整个社会生产协作和文明发展进程的工具。
作为目前最接近“人工智能”的应用,ChatGPT类产品商业场景的应用领域十分广阔。因此,ChatGPT概念成了元宇宙之后的又一大风口,也激发了国内科技圈和投资者的强烈关注,不少国内科技企业开始建立或重新重视起自己的生成式AI项目。2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》甚至提出,今年要全面夯实人工智能产业发展底座,支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。
目前我国在大语言模型乃至AI领域,与业内顶尖水平的差距依旧明显,这其中有基础、技术、时间和资本等多方面的因素。但就ChatGPT而言,它也不过是刚刚起步,甚至连商业化的第一步都还没有走稳,这就给了中国的科技企业以极大的机会,去研发,去探索,去积累,去赶超。
最后,就在本文截稿时有消息传来,我国第一个对话式大语言模型MOSS已由复旦大学自然语言处理实验室邱锡鹏教授团队发布,现邀请公众参与内测,有兴趣的小伙伴不妨前去一试(https://moss.fastnlp.top)。