ChatGPT之后:如何激活我们的创新能力?
最近,随着ChatGPT的火爆,关于我国创新能力的讨论又开始热闹起来。我身边的不少朋友在试用了ChatGPT之后,都先被这款软件的强大能力所震撼,然后就陷入了沮丧,感叹这样划时代的创新产品为什么没有先出现在中国。
应该说,这确实是一个值得深思的问题。从直观上看,我国是具备发展类似ChatGPT的基础的。首先,和美国一样,我国拥有体量庞大的数字经济,很多科技企业即使在国际上也拥有强大的竞争力。其次,我国人口基数庞大、应用场景丰富,对于类似产品具有很大的需求潜力。再次,在人工智能技术方面,我国的实力也相当不俗。如果以每年申请专利和获得专利数量来看,完全有和美国一较高下的能力。
并且,构成ChatGPT最关键的一些核心技术,如Transformer架构,以及自回归等训练方法其实也都是早已有之的技术,对于国内的科技大厂而言,并不算什么新东西。事实上,在ChatGPT获得一片赞誉之后,很多国内企业纷纷宣布会在短时间内拿出足以和其对标的产品,我们也可以看出,我国其实是完全有能力开发出类似ChatGPT的产品的。
但问题就在于,既然我们已经具备了开发出ChatGPT的相关技术,也有很好的外部条件,但为什么首创者不是我们?诚然,在发现了ChatGPT的价值之后,我们可以马上利用手中的技术“复刻”一个差不多的产品。
但“复刻”的意义毕竟不同于首创,这一点不仅体现在理论上,还体现在实践上。由于像ChatGPT这样的产品具有很强的网络外部性,因此当它的先发优势一旦确立,后续的类似产品想要再对其进行赶超就会遇到巨大的困难——这一点,从谷歌对ChatGPT的徒唤奈何就可以看出来。在这样的背景下,讨论我国创新能力的问题就更有现实意义了。
在展开对创新问题的讨论之前,有必要先对创新的定义做一些简单的界定。在文献中,创新的定义有很多,其中最为经典的一个来自于著名经济学家约瑟夫·熊彼特。在1912年出版的著作《经济发展理论》中,他将创新定义为了“对所能支配的原材料和力量”的“新组合”。
在熊彼特看来,生产的过程就是对要素的组合,如果这种组合方式是固定不变的,那么它就不会对经济发展有什么贡献。只有突破了既有的组合方式,实现了组合方式的创新,经济才能从简单循环中挣脱出来,发展才能得以实现。
熊彼特认为,创新有很多种形式。在书中,他列举了其中的五种:一是推出新产品;二是采用新的方法进行生产;三是开辟新的市场;四是获取和控制新的原料供应来源;五是实现新的组织形式。
可以看出,熊彼特意义上的创新和我们平时所理解的创新涵义并不一样。在日常语境中,“创新”一词通常是指发明创造,它对应的是熊彼特所讲的前两种创新,即新产品的推出和新生产方法的引进。从经济理论的角度看,这两种创新的作用是让经济的生产可能性前沿向外推动,让同样的经济要素实现更多的产出。而后三类创新的作用则不同,它们所实现的是让经济从生产可能性曲线的内部移动到生产可能性曲线的边界上,让既有技术条件下的闲置产能被充分地利用起来。
这里需要强调两点——
第一,前面两种创新是十分重要的,但后面三种创新也绝不可忽视。这一点,从中国改革开放以来的实践就可以明显地看出。在这段时期内,我国通过市场化的改革激活了庞大的市场,从而让生产资料能在全国范围内得到有效的配置。这一过程不仅极大解放了生产力,也让全国人民的生活水平得到了巨大的提升,其意义绝不亚于任何一次重大的技术革命。
第二,以上五种创新形式在某种程度上也反映了创新的不同阶段。在现实中,一种新的产品从产生到市场化,是一个连续的复杂过程。在这个过程中,每个阶段的参与者都不尽相同。
例如,在新产品的发明过程中,首先需要研发人员的努力,一个科学理论或者一个构思能否变成一件产品原型,主要依靠他们。在有了产品原型之后,创新的关键就落到了企业手里。企业家需要根据对市场的判断将产品原型变成真正的产品。到了这一步,新产品才算是真正面世。类似的,在对产品的制作流程进行创新的过程中,也需要这种研发人员和企业之间的紧密合作。
在这一系列任务完成之后,企业就成为了更关键的创新主体。无论是新市场的开拓,新原料供应来源的发掘,还是新组织的构建,都是企业需要做的事。由此可见,单纯依靠研发人员或者企业家都不可能完成一个完整的创新过程。换言之,要激发创新的力量,就需要他们之间的密切配合和良性互动。
在对创新的基本概念有所了解后,我们就可以来进一步讨论我国目前原创力不足的原因。关于这个问题,目前已经有很多人从不同角度给出了不同答案。例如,一个广为流传的观点是,这是由于华人的思维习惯和教育模式所致。在我看来,这种观点显然是错误的。一个典型的例子是,在ChatGPT的开发团队中就有大量的华人,并且其中的相当一部分是在国内接受过高等教育的。由此可见,用思维习惯和教育模式来解释创新力不足的观点是站不住脚的。
相比之下,一个更为可取的思路是从创新过程中各主体的激励角度来对这个问题进行思考。如前所述,在一个完整的创新过程中,至少有两类主体是十分重要的,一类是科研人员,一类则是企业家。很显然,要实现原创,就必须给予这两个主体以足够的激励。那么,现在这两个主体的激励是怎么样的呢?
先看科研人员。科研人员致力于研发的动力来自哪里?对于这个问题的回答,我想借用知识产权界的一句话,叫做“天才之火和利益之油”。也就是说,作为科研人员,他们的激励来自两方面:
其一是相对超脱的,即对于自然规律天然的好奇,这可以说是一种内在的激励。从历史上看,大量重要的科学发现源于天才人物们的好奇。不过,这里需要指出的是,这种好奇并不纯粹来自个人自身。在很多时候,天才之间的交流、竞争甚至恩怨其实是可以大幅激发这种好奇的。
一个典型的例子是,牛顿之所以会写出那部改变整个物理学历史的《自然哲学的数学原理》,并不是拜那个传说中的苹果所赐,而是为了回应时任英国皇家科学院院长胡克对自己的指责。而微积分之所以会产生,也是由于牛顿和莱布尼茨的互相激发以及互相争斗。可以说,如果没有当时那个活跃的学术环境,那么物理学和数学的发展可能要慢上很多。
其二是相对务实的,即创新可以带来的经济回报,这也是所谓的外在激励。诚然,对于一些人来说,对于事物本身的好奇就足以激励他们去进行不懈的探索了,但对于更多的人来说,他们进行创新的主要动力则是基于经济动机。
以著名的“发明大王”爱迪生为例,在通常的叙事中,他是一位“单耳不闻窗外事,一心一意搞研究”的“发明宅”。但这个印象其实并不正确。事实上,历史上的爱迪生除了是一位发明家外,还是一个了不起的企业家,著名的通用电气公司就是由他缔造的。作为一名企业家,爱迪生当然非常在意发明给自己带来的收益。因此在他的发明生涯中,很多发明都是由利益驱动的。
甚至在一些时候,出于利益的需要,他还阻挠过其他发明家的创造,其中最著名的案例就是他和特斯拉的那段恩怨。当然,这是题外话,在此不作展开。可以想象,对于爱迪生这样的研发人员,如果不能给予他们的创造工作足够的经济回报,那么他们的创造精神就会大打折扣。
在明白以上两点之后,就可以进一步分析我国现在的研发人员究竟存在什么问题。大致上讲,研发人员主要分布在两个地方,一个是高校和科研机构,另一个是企业。
对于在高校和科研机构的研发人员而言,无论是内在激励还是外在激励都存在着很大的问题。
首先是内在激励。如前所述,内在激励的来源要么是自身的爱好,要么是与同辈的交流。然而在现有的科研单位激励之下,科研成果被量化为了很细的标准,例如发表多少论文,获得了多少影响因子。而要实现这些目标,科研人员所要做的就是按照期刊的要求去撰写尽可能多的论文。
在此过程中,他们原本的激励会被扭曲——他们对于一个问题是否有趣、是否有开创性的关注会大幅减少,相比之下,他们会更加关心期刊的主编喜欢什么、审稿人可能是谁、可能会有哪些偏好。而如果有了一个好的想法,在把这个想法变成论文并发表之前,他们也很少敢把这些想法分享给其他人,生怕别人盗用了这个想法抢发了论文。这样一来,他们的内在激励就很低。
其次是外在激励。尽管在过去几年内,我国科研人员的待遇有了很大提高,但相比之下,他们的薪酬待遇依然是低于企业水平的。尤其是那些最年富力强、最有创造力的科研人员,由于受职称、级别等因素的限制,其薪酬待遇反而更低。在很多单位,科研人员只有很低的基本工资,如果要获得额外的绩效奖励,就需要达成相应的发表。
而由于我国科研体系和实业界的严重脱节,所以这就更加激励越来越多的科研人员去“卷”对现实无用,但更容易发表的题材。在过去几年中,我国高校和科研机构的论文发表数不断上升,但论文的含金量却一直堪忧,其原因就在于此。
那么在企业的科研人员呢?应当承认,和在高校、科研机构的科研人员相比,我国企业的科研人员在待遇方面通常有很大优势,并且其从事的研发任务本身就是为企业服务的,所以更接地气。但同时应该看到,在他们身上也存在着很大的问题。
其一,由于他们的任务是实用导向的,所以其研发的自主性就会受到相当大的限制。一般来说,除了完成企业交给的研发任务,他们很少有时间、有激励去思考一些更为根本性的问题。其二,由于企业之间通常存在着彼此竞争的关系,考虑到保护商业秘密的需要,它们的研发人员很难就一些技术问题进行深入的交流。这样一来,各个企业之间就成了事实上的知识孤岛。显然,这是很不利于有意义的研发活动的开展的。
和研发人员相比,企业家对于事物本身的好奇并没有那么强烈,他们更在乎的是创新的成本和收益状况。如果在同等的收益下,一个项目具有更少的风险、更低的成本,那么它就更容易成为企业家们选择的对象。
那么,在熊彼特所说的五种创新形式中,哪一些的风险更高,而哪一些的风险更低呢?总的来说,后面三种创新的风险远低于前面两种风险。在现实中,如果我们发现某货物在甲地的市场价格比乙地低,那么只需要在甲地购入该物品,再到乙地贩卖,就可以完成套利。一般来说,这个开拓市场的创新过程所需要承担的风险很少。
但是,如果我们是发现市场上对某种新产品——比如类似ChatGPT这样的生成式AI模型有很大需求,通过创造一个这样的产品来满足这个需求将会是要承担巨大风险的。
我们知道,在训练ChatGPT的前身——GPT-3的过程中,仅GPU就投入了一万块,每一块GPU的售价高达九万多美元。对于一般的企业来说,这样天价的投资已经是难以承受的了。但花费这样的投入,能不能换来产品的成功呢?不一定。因为这取决于很多因素,例如相关基础设施的配套、用户口味的变化、监管环境的动态等都会对其产生影响。而一旦产品没有获得市场的认可,那么先期投入的各种资源就会成为沉没成本,最终血本无归。
在这种情况下,如果企业的决策者是理性的,那么他的最优选择是宁愿先等一等,让对手的产品先去试探一下市场的反应,如果它成功了,就进行跟随。虽然从最终获利的状况看,跟从者或许不如原创者,但如果对成本收益进行综合衡量,那么这或许是一种更优的策略。
这里尤其需要说明的是,对于我国而言,还有一个重要的特征,那就是总体来说我国的市场和欧美市场的整合性还不够高,尤其是在数字经济领域,受监管因素的影响,基本呈现平行发展的局面,因而借鉴国外先进产品所能获得的相对收益也就更高。在这种格局下,中国的企业投入大量资源来开发原创产品的激励就更低。
在我看来,以上所指出的研发人员和企业家的激励不足,乃是制约我国创新精神,尤其是首创精神的最关键因素。因此,如果要激活我国的创新能力,让我国能够创造出领先世界的产品,就需要解决好这两者的激励问题。
那么,如何才能有效激发科研人员和企业家的创新热情,从而让我国的创新能力得以迸发?很显然,这需要包括科研单位、企业,以及政府在内的各方主体的共同努力。其中,政府作为协调者,其作用尤为突出。它必须利用各种政策手段,创造出良好的制度环境,将包括研发人员、企业家在内的所有创新主体的积极性都调动出来。具体来说,政府可以考虑采用如下的政策:
第一,应当对现有高校和科研机构的激励体制进行大力变革。
首先,应当改变当前以论文、影响因子为核心的考评体系,将研究成果的社会影响纳入到对研发人员的考评标准当中。这一点是非常重要的。在当前的学术体系下,论文投稿、审稿的体系非常漫长,这让论文作为新技术传播渠道的职能已经大为削弱了。这就导致一个机构的论文发表能力与其真实的研发能力,以及其与社会的贡献严重不对等。
最为典型的一个例子就是ChatGPT的横空出世。按照惯例,一个机构在推出具有重大变革性的产品时,都会同时发布论文。而OpenAI在推出ChatGPT时,并没有发表任何论文。但正如我们所见,ChatGPT对整个人工智能行业,乃至全社会产生的影响却是任何一篇顶级刊物的论文都无法相比的。
我想,这其实为我们的科研体系树立了一个很好的范例。如果能在激励机制上进行一些调整,允许这样的产品替代论文在职称、薪酬评定过程中的作用,那么就会有相当一批研发人员会将工作的重心转移到开发更有实用价值的产品上来。
其次,对于现在研究机构和产业界彼此隔绝、各行其是的现象予以干预。应当学习国外的先进经验,积极鼓励研究机构与企业之间的人员流动,让科研机构的人能够真正了解业界所需所想。唯有如此,才能让科研机构创新有的放矢,产生真正的价值。
再次,应当强化对研究人员的知识产权保护,畅通科研成果的转化路径。只有这样,才能让研究人员切实从自己的研发成果当中分享到经济收益,他们才会更有动力去进行创新。
第二,应当加强与重大创新相配套的基础设施的建设,减少企业为创新付出的成本。
我们前面已经指出,企业之所以不愿意去做原创性的产品,一个重要的原因是研发的风险很高,即便产品推出后,市场的风险也很大,因此从成本收入的角度考虑,企业就更愿意去做一些更为安全的套利型创新。很显然,针对这个情况,政府有必要采取措施降低企业的创新成本。
在现实中,企业推出原创产品的成本是由很多部分组成的,其中既包括研发阶段的,也包括产品推出后的运营和推广费用。在很多时候,后一部分的成本甚至要比前一部分更高。
以ChatGPT等新型AI产品为代表,它们究竟能不能很好地发挥作用,很大程度上取决于最终的客户能否以相对低廉的成本使用它们。我们知道,这一类AI产品的使用是需要消耗巨大的算力和庞大的电力的。这些算力和电力究竟由谁来供应?靠企业吗?如果要求已经付出了巨大研发成本的企业来提供这一切,那么显然对它们而言,成本过于巨大了。而且,由于企业的服务范围是相对有限的,因此建设算力和电力基础设施并不能有效实现规模效应,从经济上是不划算的。
而相比之下,让政府来承担这一切则更有效率。如果政府可以建立足够多的“数字基础设施”,并通过采用“东数西算”等方法,有效规划算力、电力等重要资源的布局,让用户随时都能用上这些资源、用得起这些资源,那么企业在研发AI大模型等产品的时候就没有了后顾之忧,它们的创造力就可以在很大程度上被激发出来。
第三,应当积极支持开源社区的建设,促进创新环境的生成。
著名的经济史学家乔尔·莫基尔在研究近代欧洲崛起的过程中,曾经提出过一个重要的观点:创新文化是欧洲得以在近代率先完成工业革命,并且一度领跑世界的关键。众所周知,欧洲虽然和我国面积接近,但却是由众多分散的国家构成的。这些国家之间经常彼此斗争,甚至相互征战。按理来说,这样的情况是很难在创新上形成合力的。但为什么就是在这样的情况下,欧洲的科技却曾经在很长时间内领先呢?
在莫基尔看来,这主要得益于学术界的统一文化。当时,虽然欧洲各国彼此不和,但全欧洲的学术界却是统一的。不同国家的学者都使用拉丁语,并彼此通信,相互辩论。比如,牛顿是英国的,而莱布尼茨是德国的,但他们之间可以打持续几十年的笔仗。这种统一的学界文化让新的科技思想可以迅速扩展。而与此同时,不同国家之间又是相互竞争的,因而各国为了在竞争中获得优势,都会争相把最先进的科学成果进行转化,为富国强兵服务。这样一来,整个产学研的良性循环就形成了。
从某种意义上讲,现在数字经济领域的开源文化其实就类似于当时的欧洲——在开源社区内,人们可能来自于彼此竞争的公司,但却会把最先进的思想和技术都贡献出来,将它们变成公共知识。而不同的企业则可以按照自己的需求,对这些公共知识加以利用,推出自己的产品。可以毫不夸张地说,这些开源社区正在成为孕育新技术的摇篮。
以生成式AI的发展为例,其实它涉及的很多训练算法和训练架构,甚至包括Transformer这样的关键技术,都是由开发者们首先发布在开源社区,然后通过大量开发者的讨论、改进,最后才得以完善的。可以想象,如果我国要发展自己的生成式AI,开源平台和开源社区是必不可少的。
虽然现在世界上已经有很多著名的开源社区,但一方面,我国企业在这些社区的话语权并不大;另一方面,对这些社区的利用很容易受到国际关系变化,以及国外政策风险的影响。在这种背景下,构建中国自己的开源平台,繁荣中国自己的开源环境和生态就成了当务之急。要实现这一点,政府不仅应当投入适当的资金和政策支持,还应当加强对企业的引导,鼓励它们参与到这些社区当中去,为中国的开源生态发展作出贡献。
如果政府可以做到以上三个方面,那么科研人员和企业家的创新积极性就可以得到相当程度的激发。不过,还有一个重要因素会严重限制我国的创新能力,那就是各种关键技术上的短板所造成的客观限制。
还是以生成式AI为例,应当看到,无论是在软件还是硬件方面,我国面临的挑战都还有很多:一方面,无论是现在生成式AI最常用的各种训练算法,还是Transformer等重要的训练架构,基本都是出自于国外的研发团队,而对比之下,我国在这些核心技术领域的贡献则较少。
虽然所有的这些算法和架构都已作了开源化,可以供全世界研发者使用,但如果我们在手中缺乏核心技术的条件下使用这些资源,就很难对搭建的模型做到完全的自主可控,可能随时面临被“卡脖子”的风险。
更为重要的是,如果一味追随已有的算法和架构来开发生成式AI产品,就可能让我国陷入路径依赖,很难在这个领域实现弯道超车、后来居上。另一方面,在硬件方面,我国的短板更为明显。在训练大型生成式AI模型时,对高端芯片的需求非常大,但我国在研发、制造该类芯片方面的能力依然十分薄弱。
在这种情况下,为了扫清创新路上的障碍,就需要国家动用产业政策,对这些关键的部门进行重点攻关。这里就涉及一个问题,即如何来设计产业政策。
传统上,我们讲到产业政策时,就很容易想到“挑选赢家”的策略,即由政府挑选一些产业、一些企业,给予各种资金和政策优惠,鼓励它们的研发。到目前为止,这种思路依然是非常有影响的。比如在ChatGPT火爆之后,一些地方就提出了要扶持一些重点企业打造对标产品的设想。
不过,从经济学的角度看,这种策略其实并不是最有效的。由于市场的动态性,“挑选赢家”的策略很难甄别出真正的赢家,反而会对市场造成扭曲。在现实中,一些本来应该在市场竞争中被淘汰的产品和技术路径由于在一开始被幸运地选为了“赢家”,反而可以战胜那些更优的产品和技术路径,成为市场上的幸存者。
更有甚者,一些所谓的“赢家”甚至可能为了骗取补贴和优惠而弄虚作假,从而给国家造成重大的损失。因而,在制定产业政策,尤其是鼓励创新的产业政策的过程中,应当努力改变这种思路。
与上面这种思路相比,一个更为可取的产业政策思路是借鉴美国国防部高级研究计划局的做法。让国家出面组建一个类似的机构,用它来整合分散在各机构的研究资源。
该机构应当具有较高的独立性、较为扁平的组织结构,以项目经理人制度为基础,提出一些需要重点项目,从企业、科研机构和政府工作部门抽调专门人员来进行攻关。这样,就可以打破不同企业、机构之间的隔阂,从而对关键技术实现重点突破。在研究取得进展后,再由该机构通过招标采购等方法,对相关技术的成果转化提供一定的资金支持,迅速促进其商业化。
当然,在招标的过程中,派人员参加了研发的企业和机构可以获得一定的优先权,而参与先期研发的人员则可以在商业化过程中获得一定的股权激励。通过这种设置,就可以有效地整合分散的研究力量,同时比较好地处理创新过程中各方的激励问题。