我们不需要中国版ChatGPT
文|观潮新消费 王叁 编辑|杜仲
"搭不上(ChatGPT)这班车,有可能被淘汰。"
2月9日,周鸿祎在一场与张朝阳的直播对话中谈及ChatGPT时如此评价。不过,周鸿祎还提到,拥有技术积累的企业才能搭上这辆车,"没有在服务器、算力上投入,也没有AI团队的企业,宣布入局都是在蹭热度。"
几天后,原美团联合创始人王慧文在朋友圈发文:5000万美元,带资进组,不在意岗位、薪资和title,求组队。言外之意,正是要在AI赛道上先站位、再组队,尴尬的是谁,周鸿祎没说。
在此之前,王慧文就曾在社交平台上多次谈及AI,态度直白而清晰:"关于人工智能到现在为止,我只有一个判断,必须参与。"
一天后,王慧文在社交平台再发求贤令,宣布"打造中国OpenAI"。王慧文表示出资5000万美元,估值2亿美元,个人肉身不占股份,资金占股25%,75%的股份用于邀请顶级研发人才。
"不必为资金忧心,放心施展你的才华,杂事交给我打理。"
天眼查显示,由王慧文担任法人并全资持股的"北京光年之外科技有限公司"成立于2018年,注册资本100万人民币,经营范围包括销售自行开发的产品、计算机系统服务等。
此前,王慧文曾是美团的联合创始人、高级副总裁,这段职业生涯停止于2020年12月18日。谈及离任的原因,他曾说,"一直担心人生被惯性主导,怠于熟悉的环境而错过了不同的精彩。"
"不同的精彩",看来正是岁末年初科技圈最火热的ChatGPT。
01 ChatGPT的诞生
对于2022年,太多人的记忆停留在抗原的两道杠上,连什么时候开始不扫码这件事都已经印象模糊,让每年一度的"元年系列"略显尴尬。
实际上,2022年应该是AIGC元年。
AIGC(AI Generated Content)是指利用人工智能技术生产内容,它也被认为是继UGC(用户生产内容)、PGC(专业生产内容)之后的新型内容生产方式。AI绘画、AI写作等都属于AIGC。
2022年,AI画作《太空歌剧院》,获得美国科罗拉多州博览会艺术比赛数字类别冠军一事,曾掀起AIGC概念的小高潮,这股行业热浪也为年底ChatGPT的爆发做足了铺垫。
ChatGPT(Chat Generative Pre-Trained Transformer)是一款由AI技术驱动的自然语言处理工具,呈现方式是聊天机器人,这是AIGC技术领域中的一款具体应用产品,由OpenAI公司于2022年11月推出。
用更简单的公式来解释:如果AIGC=电商,那么OpenAI=阿里巴巴,ChatGPT=淘宝。
AIGC的行业积累和ChatGPT的功能飞跃,让这款应用的爆红显得顺理成章——它不仅可以回答用户的各种问题,还能修改代码、撰写论文和诗歌。ChatGPT像真人一样联系上下文的连续沟通能力,让人工智能看起来不再像是"人工智障"。
无数网友涌入ChatGPT,通过五花八门的问题试探ChatGPT的能力边界,并在社交平台上进行大规模的自发传播,一举让ChatGPT成为迄今为止用户破亿最快的应用。
之前的记录是TikTok的九个月,而ChatGPT只用了两个月。
事实上,创造ChatGPT的OpenAI公司自诞生起就是硅谷科技圈的"明星"。
OpenAI成立于2015年,由山姆·阿尔特曼(美国创业孵化器Y Combinator总裁)、彼得·泰尔(PayPal联合创始人)、里德·霍夫曼(LinkedIn联合创始人、PayPal高级副总裁)和埃隆·马斯克(特斯拉CEO)等人创办,这些人无一例外都是硅谷科技圈的明星人物。
时间退回2013年,马斯克与当时还在谷歌大脑工作的伊利亚·莎士科尔,在硅谷的瑰丽酒店一个私人包厢里吃饭聊天。
那一年,特斯拉刚刚火遍全球,马斯克又接连创办了SpaceX和Solar City两家公司,正处于思维大爆炸的人生阶段。而当时的谷歌大脑是AI领域最先进的团队,正在研究搭建深度神经网络,这是让AI通过阅读数据自主学习并完成任务的网络基础,也就是当年最火热的"深度学习"。
酒过三巡,菜过五味,饭桌上多了几个人,其中一位正是山姆,他的YC曾孵化过Airbnb等千亿级独角兽。山姆还带来了格雷格·布罗克曼,一位AI领域的创业者,也是OpenAI日后的CTO。
这几个人一拍即合,他们要创造一个新型AI实验室,让新技术摆脱谷歌等巨头的掌控,将深度学习从学术界转移到商界。
当然,科技大佬并不是成功的保证,他们都有自己的主业,但他们的存在自带吸引力:他们能够从谷歌微软脸书等巨头手里挖走一批科技精英,这些精英才是日后OpenAI成功的保证。
2015年初创后的很长一段时间里,OpenAI都是作为一家非营利组织存在的,直到2019年,情况发生了变化。
当时,OpenAI从一家非营利组织转变为一家有"利润上限"的营利组织,并建立了一个独特的利润结构——投资回报有上限(投资利润不超过投资额的100倍),任何超出的部分都将返还给非营利组织。
也是从这一年开始,OpenAI作为一家技术型企业获得了硅谷大佬的关注,并由此引发了一场巨头之间的"攻防战"。
02 抓住那只ChatGPT
2019年,OpenAI正式进入微软视野,后者先后投入了共计30亿美元的投资额,不久后,双方的合作也逐渐拓展到产品和技术层面。比如,OpenAI在2020年发布了GPT-3语言模型,微软于同年取得独家授权。
2023年1月,ChatGPT爆火,外媒报道称微软对OpenAI的投资或将追加到100亿美元。《财富》记者杰里米·卡恩根据熟悉该交易的消息人士和一些内部文件,披露了这笔交易的详情:
OpenAI将75%的利润交给微软,直至微软收回共计130亿美元的投资;
当OpenAI的利润达到920亿美元后,微软获得OpenAI利润的比例降至49%,其他风险投资者和OpenAI的员工将获得公司49%的利润;
当OpenAI的利润达到1500亿美元后,微软和其他风险投资者在OpenAI的股份将归还给OpenAI的非营利基金会。
除了"财务对赌",微软还在进一步借OpenAI的研发实力丰满羽翼。
公开信息显示,微软或将OpenAI的技术集成到旗下的搜索引擎Bing(必应)当中,这显然会威胁到搜索引擎巨头谷歌的霸主地位。
很快,谷歌出手了。
外媒报道,谷歌母公司Alphabet的CEO桑达尔·皮查伊在内部发布"红色警报",紧急召回了早已退隐江湖的两位联合创始人——拉里·佩奇和谢尔盖·布林,主导推进ChatGPT竞品的研发工作,一场"军备竞赛"悄然打响。
12月7日,谷歌官宣将发布自家旗下ChatGPT类聊天机器人产品Bard,并发布演示Demo;
12月8日,微软上线ChatGPT版Bing+Edge,比之前宣布的3月提前了一个月。
12月9日,谷歌在法国举行公开活动,对Bard进行功能演示。
可惜Bard出街的这一天也成了谷歌的尴尬日。
在这次演示中,Bard被问及关于JWST(James Webb Space Telescope,詹姆斯·韦伯太空望远镜)的问题时回答称,JWST拍下了"太阳系外行星的第一张照片"。天体物理学家特瑞布雷发推指出,太阳系外行星的第一张图片是在2004年使用自适应光学技术的VLT/NACO拍摄的。
明明是要来秀肌肉的大汉,却忘了脱掉旗袍,只能对人说这样显得优雅。
"大炮一响,黄金万两"。Bard的公开"翻车",直接导致谷歌股价一夜蒸发超1000亿美元,而谷歌发言人也只能无奈做出"这凸显了严格测试过程的重要性"这种和稀泥式的回应。
只不过,临时抱佛脚的谷歌公开丢人,先下手的微软也暂时没占到多大便宜。
《财富》称,OpenAI在2022年预计亏损5.45亿美元。尽管OpenAI预计其收入有可能从2022年的不到3000万美元迅猛增加至2024年的10亿美元,但即便按照这样的发展速度,OpenAI距离与微软交易的"三个小目标",仍相去甚远。
原因在于,ChatGPT越红火,OpenAI的收入反而越可能降低,因为用户的每一次调用,就会让OpenAI付出更多的计算资源和带宽成本。
OpenAI想要扭亏,仍要靠尽快寻找合适且高效的商业化路径。
2月1日,OpenAI 官宣推出ChatGPT的个人付费订阅服务"ChatGPT Plus"。用户支付20美元/月的费用,即可享受高峰时段的优先访问、更快的响应速度以及优先尝鲜新功能等高级服务。
但这种变现方式还是缓慢,就连OpenAI自己也难以分辨当前暴增的用户中有多少是来尝鲜的,又有多少能成为付费用户。
而说到技术落地,从进入移动互联网时代开始,能贡献教科书级别操作的企业都在大洋彼岸——从一个想法到一个应用,OpenAI经历了十年,而国内企业"搭上这班车"的时间还不到四个月。
其中甚至还有个春节假期。
03 谁是中国版ChatGPT?
人类对于新鲜事物的爱恨总是难以捉摸,AI聊天机器人从0到1的跨越被嘲讽为人工智障,但从1到2的进步却被急不可耐地描述为未来该有的样子,尽管其中夹杂着难以否认的事实错误。
ChatGPT的走红,是AI企业用以证明自己平时刻苦用功而非摸鱼的良机,毕竟只有当高考真正到来的时候,每天喊着考清华的人才会消停。
国内技术型大厂中,最先明确表示要跟进AIGC的是百度。
2月7日,百度官宣将在3月上线百度版ChatGPT——文心一言(ERNIE Bot)。作为国内搜索领域的AI巨头,百度表示公司在文心一言的底层模型"文心"系列上已布局多年,"ChatGPT相关技术,百度都有"。
具体来看,百度在人工智能四层架构中有全栈布局,包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用,而文心一言位于模型层。
(百度文心大模型全景图,2022年底发布)
2月8日,有报道称网易有道已投入相关研发多年,未来或将推出ChatGPT同源技术产品,应用于在线教育。一天后,腾讯也公开回应了ChatGPT相关话题,口径依然是"早有布局"。据称,腾讯的技术储备主要是"混元"系列AI大模型和智能创作助手文涌(Effidit)。
至于文章开头提到要搭上车的周鸿祎,也说要尽快推出产品。360方面表示,公司在数据资源端有丰富的多模态大数据积累和相关语料,尤其是中文语料。公司有充足的资金储备可用于购买大规模算力,也不排除吸引强有力的合作伙伴取长补短。
言外之意,有钱,速来。
信息服务巨头相继官宣,占据互联网另外半边天的"电商系"也不遑多让。
2月9日,有媒体曝光阿里内测中的达摩院版ChatGPT聊天截图,该应用或建筑在阿里在2021年研发的、号称"国内首个拥有千亿参数"的中文多模态预训练模型"通义-M6"之上。阿里强调M6大模型的多模态能力("文本-图像"的交叉理解和生成),或因M6主要服务于客服聊天。
阿里冒头,京东不可能往后稍。京东集团副总裁何晓冬透露,京东智能人机交互平台"言犀"是大规模商用的客户服务系统,未来京东也会不断结合ChatGPT的方法和技术点,将其融入产品服务。
ChatGPT一人得道,国内大厂鸡犬升天,但具体到应用层面,恰恰透露了国内企业打造中国版ChatGPT的关键问题:
从量变到质变的过程中,数据和技术之间的龃龉。
阿里达摩院汇聚国内AI领域最优秀的大脑,但目前的产品只够服务电商平台,想要破圈,就要面临被数据"卡脖子"的问题。中文市场的文本数据,更多集中于搜索、社交这样的应用当中,那么手握中文信息话语权的百度和腾讯,就一定能做出更好的聊天机器人吗?
未必,毕竟今天互联网平台之间的天堑还未完全弥合。
百度数据库里固然有大量文本信息,但主要是搜索与解答、论文、新闻类书面化文本;那些更日常、更时兴的表达类语言信息,则集中于社交平台。两者之间各自为营,给人工智能"跨服"进行综合语义学习竖起了天然屏障。
比如,YYDS、XSWL是拼音首字母,NBCS、GOAT是英文短语的首字母,其中goat本身还是个英文单词,这些拼音和字母夹杂在中文里,会给机器学习带来麻烦,尤其是当日益增长的新词汇并不在搜索平台,而是在微博或豆瓣的时候。
人类语言千变万化又彼此隔阂,中文是其中最复杂的,甚至没有之一。就算人工智能悉数掌握,也不可能建起人尽皆知的通天塔。
由此可见,即便中国科技巨头的技术储备并不逊色于美国,但中文聊天机器人的落地并不会引发ChatGPT似的轰动效应,展示肌肉后,终究还是要落回自身主业。
04 谁在鼓吹ChatGPT?
很多人被动接受了一条信息——ChatGPT可能取代人类,但这则信息的来源却不是发布产品的企业。这些企业追逐乃至引领变革,但并不敢夸大其词,毕竟科技圈的风口总是来了又去。
在迷人的高科技概念真正融入现实之前,总有一批批跟风的企业会被拍在沙滩上。"风口上猪都能起飞"的论调给太多人造成了错觉,飞行领域中最难的不是起飞,而是悬停,风口能把人带到某个高度,能留在这个高度才是能力的体现。
故而与其说ChatGPT引发了一场足以载入史册的变革,不如说它给消费者一个看到变化的机会。
近十年来,多家企业都宣称投入AI,但最终产品大部分面向B端,对于C端用户而言,AI对日常生活的影响多数都只是"润物细无声"。
这次ChatGPT落在C端犹如"平地一声雷",引得各家企业纷纷在最短时间内拿出产品。只不过技术和应用之间总有错配,要不了多久,这些秀过肌肉的公司仍要回归正常轨道。
正如张朝阳所说,算力要有多少服务器,知识库及标注数据(多少规模)等都是问题。除非是在AI人工智能及搜索方面具备相应能力,不然入风口需谨慎,避免造成资源消耗。
既然各家大厂选送的"中国版ChatGPT"还悬在空中,当下到底谁能通过ChatGPT的风口赚钱呢?
今年2月初,闲鱼等二手电商平台拉黑了一批倒卖ChatGPT账号的用户,这是由于国内手机号不能注册ChatGPT账号,于是不少资源王者做起了海外手机号批量注册的生意,网传有人月入十万。
除此之外,也有人在利用ChatGPT的创作能力增加收入。比如利用聊天机器人写代码、小说、剧本,或者进行翻译。
据公开信息显示,目前已有超过100家机构成为文心一言的生态合作伙伴,其中超过半数的合作方都是媒体机构。这些机构最终到底能借助智能文本工具赚多少钱姑且不谈,AI背书带来的关注度和流量,就足以铺出一个宏伟商业故事的蓝本。
毕竟美国新媒体公司Buzzfeed,就在宣布用ChatGPT做内容之后股价一夜翻倍。
从技术层面看,ChatGPT所提供的辅助作用与早就诞生的互联网工具类似,只是能力有了极大进步。至于如何界定这种行为的合理性与合法性,在相关法律出台之前都会是让人头疼的问题。
比如2月中旬,美国、澳大利亚、印度、英国的一些学校就开始禁止学生使用ChatGPT,更有多所大学宣布增加书面论文以及口语考试等课业内容,尽可能降低AI在学生作业中的直接应用。
这些相对边缘的变现方式,也把ChatGPT乃至AIGC顺势带入了伦理范畴的讨论。
AI画作兴起之后,很多人都表达过类似问题:看到一幅画的第一反应是分析它是不是AI创作的。这与AI技术刚落地时的场景相似,我们都曾质疑过对面的客服是不是机器人,也曾问过Siri是不是智障。
而以后这样的问题将会入侵越来越多的文本类场景。
当有人说"所有行业都值得用AI重做一遍"的时候,我们也不得不直面AI作为新生产力工具的另一面——以ChatGPT为代表的智能工具增加了我们获取信息的方式,也带来了判断力的新挑战。
ChatGPT的答题能力让人惊叹,但它无法保证看似言之有据的答案是否真正无懈可击。
各行各业的文字创作者都可以利用ChatGPT来辅助写作,但创作者本人依然要为内容的质量负责。毕竟当出现事实错误的时候,被嘲笑的是谷歌而不是Bard。
05 结语
2022年,小张买了一套书:《元宇宙通证》、《元宇宙大投资》和《滚烫元宇宙》,其中夹杂着一本《图说元宇宙》,这让他不由得想起前年买的《图说区块链》。
那些年币圈红得发紫,科技巨头草木皆兵,一个个造富神话让最出色的网文写手自愧不如。小张也曾想过梭哈,无奈当时的他还处在资本原始积累的阶段——简单来说就是没钱。
忘掉那些不愉快的记忆,被反复收割但总能顽强生长的小张下决心这次一定要All in。等他对元宇宙的研究深入到哲学层面,时间已经来到年底,几个名字里带有"创业"的群聊里同时传来消息:"ChatGPT,搞不搞?"