cha

ChatGPT“狂飙”背后的真正推动者

  数智讲堂

  随着ChatGPT应用的诞生,今天人们可以轻松实现与智能系统的流畅交互。未来AGI目标的实现或将进一步推动超越人类认知能力机器的开发。

  赵祚翔

  近期,OpenAI推出了新一代人工智能语言处理工具ChatGPT,该工具在互动回复、编写代码、生成创意等方面的强大功能,在全球范围内掀起了一场“狂飙”。仅仅两个月,ChatGPT注册用户数破亿,成为史上用户破亿速度最快的软件之一。并且,在微软宣布推出可以搭载ChatGPT功能的新版Bing搜索引擎后,Bing的下载量也猛增了10倍。ChatGPT的火爆预示着人工智能生成内容技术(AIGC)的市场化应用进入了新的历史阶段。

  OpenAI于2015年12月11日成立于旧金山的先锋大厦。2016年,它发布了第一个工具,用于开发和比较强化学习算法工具包OpenAI Gym和Universe,虽然该产品本质上是训练AI代理的测试平台,但其智能能力足以覆盖全球的网站和游戏程序。在随后的两年里,OpenAI专注于更通用的AI研究和开发。

  2018年,该公司发表了一篇论文“Improving Language Understanding by Generative Pre-Training”,介绍了生成式预训练语言模型(GPT)的概念。GPT是神经网络受人脑结构和功能启发的机器学习模型,可以在人类书写的文本数据集上进行训练并执行许多功能。基于GPT模型,OpenAI团队开发了GPT-1,训练模型所用的数据为Book Corpus中7000多本未出版的书籍,随后该模型演变为GPT-2。由于团队担心GPT-2可能被用来编写诈骗电子邮件或生成假新闻,OpenAI并未向公众公开。

  2020年,OpenAI推出了GPT-3,相比前两代,这一次GPT实现了明显进化和迭代,性能也更加强大。为实现这一目标,微软为OpenAI设计了一台超级计算机,其中包括285000个CPU内核和10000个GPU。借助超级计算机的帮助,GPT-3被“投喂”了45TB的文本数据,参数超过1750亿个,基本做到了能够识别更深层次的文本含义,也实现了通过训练按照提示中的说明进行操作,并提供反馈的功能。

  GPT-3的推出无疑是一场革新。2023年初,OpenAI发布了基于GPT-3架构的ChatGPT语言模型聊天机器人。其理解上下文和根据聊天记录进行调整的能力,意味着用户可以在对话线程中“训练”ChatGPT,以获得更准确的答案。在大多数情况下,它所使用语言与人们编写的文本几乎没有区别。对于许多人来说,与ChatGPT的互动是与AI的第一次有意识和超现实接触。

  根据OpenAI官方公告,OpenAI是一家非营利性人工智能研究公司。经营目标是以最有可能造福全人类的方式推进数字智能,不受产生财务回报需求的约束。但会面临巨大“沉没成本”和“不确定性”结果,能否得到持续稳定的研发投入将会成为项目能否开展的关键。2019年,OpenAI成立了OpenAI LP营利性质风险基金公司,虽然OpenAI宣布OpenAI LP是一个完全独立的实体,但实际上OpenAI LP作为一种独特的“上限利润”(“capped profit”)公司,是被允许产生利润,以吸引融资和推进项目运营。而投资者的投资收益将被限制在原始投资额的100倍。

  微软在OpenAI LP成立四个月后,紧接着在当年7月宣布10亿美元注资。截至2023年1月23日,OpenAI在6轮融资中总共筹集了110亿美元,其中最大一笔投资来自微软最新的100亿美元计划。OpenAI设立基金的动机和方案无疑为其他初创企业或非营利研发机构获得市场化资助提供了新的思路。

  虽然AI是人类创造的,但斯蒂芬霍金曾经告诉英国广播公司(BBC),“人工智能可能会以越来越快的速度重新设计自己,并通过超越生物进化来取代人类”。随着ChatGPT应用的诞生,今天人们可以轻松实现与智能系统的流畅交互。未来AGI目标的实现或将进一步推动超越人类认知能力机器的开发。虽然人工智能将如何塑造世界尚有诸多分歧,但它将在未来几年必会颠覆许多行业。当然,这些颠覆也会带来巨大的社会治理风险。

  (作者系中国科学院科技战略咨询研究院助理研究员)


您可能还会对下面的文章感兴趣:

登录 注册 退出