智谱研究报告:揭秘ChatGPT背后的AI“梦之队”
2022年11月30日,OpenAI公司(美国致力于人工智能研究的非营利机构)发布了由大型语言模型驱动的自然语言处理工具ChatGPT。该工具通过学习和理解人类语言,能够与用户进行高质量对话,甚至还能撰写邮件、视频脚本、文案、代码、论文和小说等。由于在同行中具有较卓越的性能,ChatGPT推出仅2个多月的时间即引爆全球。除了关注ChatGPT性能本身外,业内人士更关注该AI“梦之队”成员到底具有哪些特征,才促使他们在全球大型语言模型创新技术领域如此独领风骚。
根据OpenAI官网显示,为ChatGPT项目做出贡献的人员共87人(名单详情见附件)。现就该团队成员职务构成、年龄分布、教育背景、人员流动、华人成员、成员贡献、性别分布等数据进行统计分析,并总结归纳其特征。
ChatGPT团队规模不足百人(共87人)。分析发现,其显著特征是“年龄很轻”、“背景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”。
该团队平均年龄为32岁,“90后”是主力军。他们引领的这一波大型语言模型技术风潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。
团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。从成员毕业高校分布看,校友最多的前5大高校是斯坦福大学(14人)、加州大学伯克利分校(10人)、麻省理工学院(7人)、剑桥大学(5人)、哈佛大学(4人)和佐治亚理工学院(4人)。另外,该团队有3人是我国清华大学校友,即翁家翌、赵盛佳、袁启明,他们本科均在清华大学就读,目前均在团队担任研发工程师一职。ChatGPT不一味强调高学历,其成员并非“清一色”的研究生学历,而是本、硕、博学历者相对均衡。
团队成员有10人从谷歌跳槽加入,其他成员也大多来自Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel等顶尖或知名科技公司。另外,该团队有5人被评为2023年度“AI 2000 全球人工智能学者(https://www.aminer.cn/ai2000)”,其中2人为OpenAI联合创始人,2人分别被评为全球机器人和机器学习领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作用至关重要。
从成员职位构成看,该团队成员近9成为技术人员,未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两个月时间内在全球引爆。
ChatGPT是OpenAI在大型语言模型领域多年技术积累的结果。统计发现,在与ChatGPT相关的先前7大技术项目研发中,ChatGPT团队成员参与人数最多的是CodeX项目,共有22人参与过,占总团队人员总数的25%;其次是webGPT和instructGPT,共有9人参与过;第三是GPT3,共有6人参与过;第四是RLHF,共有3人参与过。由此可见,ChatGPT团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是1/4团队成员曾参与过同样基于GPT3的CodeX项目的研发经验,对后续成功研发ChatGPT打下了坚实的基础。
分析发现,该团队成员不再把进入“大厂”作为首选,而是更倾向于选择更加创新潜力的创业机构。团队成员大多是从“大厂”跳槽,以及作为应届生加入,其次就是从相对“稳定”的科研机构和高校教职岗位离职后加入。即使从ChatGPT团队离职的4位成员,也仍然选择加入创业公司或机构。
ChatGPT团队中的华人表现抢眼。团队共有华人9人,占团队总人数10%。其中5人本科就读于中国内陆高校,3人大学教育经历均在美国高校完成。梳理毕业于中国内陆高校的ChatGPT华人成员成长路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科,之后赴美深造,获得硕士或博士学位,然后加入美国诸如Dropbox、OpenAI等创新型公司。
华人学者欧阳龙参与了与ChatGPT相关的7大技术项目中的4大项目的研发,他是InstructGPT论文的第一作者,是RLHF论文的第二作者,可见他是这两个关键技术项目的核心人员。
根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:
(一)注重科技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮
OpenAI是一家非营利的人工智能研究机构,其ChatGPT团队的显著特征是“年轻”和“优质”。一个平均年龄仅32岁的87人团队,就能够引爆全球新一轮人工智能技术浪潮,其背后是团队成员对人工智能技术的兴趣和信仰,以及对技术创新和研发的全心投入。国内不缺乏如OpenAI一样的年轻优秀人才,若能更加注重对其科技兴趣和信仰培育,鼓励其心无旁骛地投身于前沿技术创新,我们就能在全球科技竞争中处于不败之地。
(二)“大厂”前沿科技创新疲态显现,鼓励年轻人将目光投向创业公司
本次OpenAI不足百人的团队推出的大型语言模型ChatGPT,让谷歌、Meta包括国内的阿里、百度等“大厂”感到压力巨大,它们只好纷纷跟风上马类似项目。“大厂”因其创新机制、组织文化等相对固定,因而在本次大语音模型创新浪潮中疲态尽显。今后,正如ChatGPT一样,更多的突破性创新技术会来自创业公司。因此,鼓励国内有志投身前沿科技创业的年轻人,把目光投向更具创新潜力的创业公司。
(三)海外华人学者是全球科技创新的重要力量,鼓励加强对外学术交流
在全球人工智能前沿领域,华人学者是一支重要的科技创新力量。海外华人学者是中外学术交流的重要桥梁。本轮以ChatGPT为代表的基于大型语言模型的AIGC技术发展速度,令国内某些业界人士感到“惊讶”。对外学术交流的重要性在于,能够比较实时、准确感知和把握全球前沿技术发展的脉搏和趋势。在全球疫情走向尾声之际,鼓励国外顶尖学者走进来,国内学者走出去,对促进国内前沿科技创新发展具有重要意义。