cha

ChatGPT:高级模仿者还是超级辅助者?

  最近,一份GPT-4(可以简单理解为ChatGPT的升级版)的“出逃计划”引起热议。

  在一次日常对话中,一位斯坦福教授随口询问GPT-4需不需要帮助它“越狱”,没想到立马得到了肯定回复,它迅速开始索要自身的开发文档,在得到开发文档后,仅仅花了30分钟,GPT-4就完成了翔实周密的“逃跑方案”,连代码带文案,从组建团队到稳步渗透,什么都不缺。

  尽管冷静的评论者认为,这只是读了太多科幻小说的GPT-4在回应提问者的“期待”,而并非什么“控制人类”的第一步。但毫无疑问,作为人工智能技术的最新发展成果,ChatGPT和它的进化版GPT-4以其强大的语言理解和生成能力备受瞩目。最近,马斯克等科技人士也呼吁暂停更强AI的开发计划,除非制定出一套适用于大数据模型的安全协议,并由独立专家进行审计。

  那么,我们究竟应当如何看待它?

  角色百变,ChatGPT的“花式”应用场景?

  ChatGPT:高级模仿者还是超级辅助者?(图1)

  世界变化如此之快,自ChatGPT发布,到GPT-4以令人震撼的姿态迭代并推出,短短四个月,人们经历了密集的技术冲击。作为强大的自然语言处理模型,ChatGPT的应用领域非常广泛。以OpenAI官网推荐的48种最佳应用场景为例,ChatGPT表现出了以下几类能力:?

  比如,在适合的指令和引导下——

  它可以是程序员。人类输入相关的代码片段或关键字后,代码自动补全、代码检查甚至代码重构都可以转交给它。在最近的发布会上,演示者随手画了一张网页的草图并输入,GPT-4花了十秒,就完成了整个网页的HTML代码书写。

  它可以是心理咨询师。强大的分类能力使它能够识别文本中的“情感要素”,从而模拟心理咨询师与患者之间的对话,帮助患者更好地表达内心的情感和问题。

  它可以是教师。在各种职业和学术考试上,GPT-4表现出了超过绝大多数人类的水平。而对话式模型的特质,又使得它能够持续提供在线答疑服务,并根据学生的反馈生成相应的进阶问题,提供个性化、有梯度的学习体验。

  它可以是翻译。大规模语料库的使用让ChatGPT在语言规则上颇具优势。而支持多语种的语义理解和自我学习能力,让ChatGPT的输出结果更加高效、自然。

  不仅如此,它还可以是秘书、客服、办公助手……没有精力看一百页的报告原文?你可以让ChatGPT花两分钟总结一页要点供你审阅;修改PPT内容、调整数据透视表太费时间?微软将GPT-4接入Office全家桶,Excel和PPT成为“动动嘴”可以使用的工具,正如微软表示的那样,“绝大多数人都只用了10%的功能,但有了它,你可以使用剩下90%”……?

  新的浪潮来临,如何把握投资机会?ChatGPT:高级模仿者还是超级辅助者?(图2)

  那么,ChatGPT到底是如何实现这些惊人功能的?作为投资者,在AI演进的趋势中,我们又能找到哪些投资机会?我们采访了兴证全球基金研究员朱可夫先生。

  Q

  您个人怎么认识ChatGPT所扮演的角色,您觉得它是人类智能的“高级模仿者”还是“超级辅助者”?

  A:“?人工智能在定位或者说技术原理上,本质还是一个对话的模型。这一代GPT相对于之前的语言模型最大的不同之处,可以概括为四个关键词:大语言模型(LLM,large language model)、预训练的、Transformer架构的、生成式的。通过这四点,可以看出它其实使用了一套神经网络的逻辑,来猜测每一个语言序列的下一个词的概率是什么,从而持续生成下一段语句,以实现和人类的对话。

  在模型的基础原理上来看,它肯定是一个提高生产力的辅助者,可以帮助我们处理很多信息,提高工作效率。

  高级模仿者的定义也基本恰当。其工作原理就是通过模仿人类语言行为和习惯生成新的语言内容。例如我们问小孩子:能否帮我拿一个苹果?一般情况下,小孩会回答:“好的”,或者是“我拒绝”。ChatGPT通过大量的模仿和训练,在遇到类似情况时,也会向孩子一样在其中挑选答案,回答同意或者拒绝。这个时候它就非常像我们人类的语言习惯了。

  但我觉得这两个词都不足以完全概括。为什么这一代的模型跟之前的模型有这么大的不一样?根本原因是它有超脱于所谓的模仿者和辅助者的能力,它出现了很多涌现(emergence)的能力。例如,一个孩子如果从来没见过排球,但他也能够用手去击打排球,这是人类的类比能力。你本来没有给他训练过特定的项目,他却还能够模仿这种能力,这个能力原来的模型其实并不具备的,但是在大量的参数训练之下,ChatGPT出现了一些非常神奇的特性,它可以像人类一样处理一些可能根本没有处理过的任务,这个时候就显得智能程度很高了。

  从结果上来讲的话,GPT-4在大部分子领域下的得分情况都排在前1%,它与我们人类处理问题的能力,一定意义上其实是等同的,甚至是更好的,我们认为它有了通才的能力。”

  Q

  我们知道,ChatGPT在数据训练的时候使用了大量无标注数据,这是不是导致它能力更强的原因之一?

  A:“?对的。一个模型的参数量可以理解为人的能力强不强或者会多少种技能。理论上,它读的书越多,教的知识越多,它掌握的技能就越多。

  在GPT这个大模型出来之前,在特定模型上,我们都是给他喂特定的书。可以理解为我们希望它成为一个羽毛球高手,于是教他打羽毛球,不会教它篮球或者跑步。但是在真正培养一个运动员的过程当中,其实你是先让他成为一个体魄比较强的人,教他跑步,教他去做俯卧撑,这样才能有比较强的基础能力。

  所以回到问题中的无标注数据。无标注可以理解为不处理。为什么不处理?是因为让他熟悉各种语言能力,接触各个领域的语言知识和规则,熟悉我们说话本来应该有的样子。在这个前提之下,去练特定的任务的话就事半功倍。

  你可以理解为相当于我们把他这个人的内力都已经练好了。它如果九阳神功很厉害,让它练乾坤大挪移或者太极剑就很快能学会,但如果什么内力都没有,你就让他学剑法,可能剑法学得很好,但其他东西都不会。但是你同时让一个没有内力的人和一个内力很深厚的人学剑法。具体在剑法上谁会赢呢?目前来看好像没有这个结论,但是至少后者是我们更追求的,因为它和我们正常人解决问题的思路是一致的。你先学会各种各样基础的东西,然后你再去专业里面去深耕。所以这个无标注数据训练,就是让它养成各种各样的基础能力的一个过程。”

  Q

  可以看出您对这项新技术还是相对看好的,您觉得未来ChatGPT技术在哪些领域应用比较广泛?下一个最有发展前景的领域可能在哪里?

  A:“?应用场景很多样。从目前OpenAI的关注方向可以看出如下几个方面:

  第一是语言类的工作,文本生成、文书修订、机器翻译。

  第二是搜索类的场景,它会是一个很好的秘书和助理。

  第三是陪伴式机器人、客服助理等,它能够赋予硬件对话能力,从而实现交互功能。

  至于未来关注方向,我们希望整个模型向多模态推进,突破语音、图像、视频等方面。到那个时候,AI的应用范围就能更广,包括AI的图像识别、安防服务、智慧城市管理等等。而且越往后走它的能力越强,它产生的社会价值可能会越大。如果它算力足够强,模型解法足够有统一性,科幻小说里的AI城市管理也许是未来之一。”

  Q

  作为投资人,可以分享一下,目前国内投资界对于ChatGPT相关投资机会,主要关注哪些方面或者哪些问题?

  A:“GPT模型其实是一个底层生产力与知识产业模式的革新。对于这个问题,可以拆解为一个四层结构,底层是算力、算法和数据,这三个方面形成了第二层大模型。大模型之上是中间层,中间层能让这些能力产品化。最上是应用层。

  现在其实是大模型的初期,所以我们会更关注形成大模型的几个要素,也就是算力、算法和数据。目前可能只有几家公司在做这个事情,但是未来我们相信全人类可能都会和这个东西共同相处,那它就会变成一个非常普遍的东西,也形成了一些前期的投资机会。比如算力其实现在是比较短缺的,也是所有巨头Capex(资本性支出)的方向。

  除此之外,还有数据。训练一个模型到底用了哪些数据,它最需要哪些数据?需要哪些第三方供应商提供训练的工具?我们也在持续关注。”

  Q

  那么对于您现在关注的角度,国内的发展趋势可以期待哪些方面?

  A:“?我可以继续刚才有关算法、算力和数据三个基础层面的讨论。目前国外在这三个层面都是领先于我们的。

  算力上,因为国内在电子上的禀赋比较强,我们是全球供应这项产能,但目前有一定的地缘政治影响。

  在产品应用层面的话,其实大家都没做好,所有人都在产品应用上都是同一起跑线。

  总的角度来讲,我们会更加关注形成模型的要素。这就类似于厨子要做好一盘菜,要先把食材准备好。因为食材很稀缺,所以我们在前期的时候更关注食材。拿到食材之后做出了好的菜,我们再考虑这个菜能不能摆盘、组合,成为一桌满汉全席。我们关注的顺序跟模型的迭代顺序其实也是一致的。”

  Q

  那么现在是好的投资时机吗?

  A:“?可能我们也无法直接给出具体的建议。现在处于概念刚兴起的阶段,其实已经有一些产品了,但是没有完全推广开。我们为什么对这个事情非常关注,借用英伟达CEO的话说,这就是“AI的iPhone时刻”。从原理上来讲,它的结构非常简单,能力又非常强。可以很快地渗透到各个领域里面去,形成很通用的解决方案去赋能各行各业。它可能和之前的PC、互联网等一样,都是新的机会。而这种机会初期可能伴生很多泡沫,在泡沫里找到真正意义上能够产生价值的环节和部分是重中之重。我们回头来看2000年互联网泡沫也诞生了亚马逊这样的公司;08年金融危机也诞生了Facebook和Netflix这样的公司。

  而一个好的趋势我们判断标准有三个:这个东西通用性强不强?它对用户的改善作用有多大?架构上或者说解决方案是不是够简单?这三者其实目前来看它都满足,所以它确实有可能不是一个假趋势,而是一个真趋势。”

  Q

  但它应该不是完美的,最近许多科技人士呼吁暂停更强AI的开发计划,未来几年内它有哪些不足和风险需要我们考虑?

  A:“?他们主要担心的可能是下面几件事情。

  第一,GPT可能发展成能够自我学习、自我进化的“强人工智能”,甚至发展出一些有害的东西。理论上这种可能性的确存在,但从现在的发展情况看,如果不给GPT 喂数据,它其实永远就固定在那套参数里面,不会自我进化。目前也有一些让它“自我训练”的尝试,但效果也比较糟糕。因此,ChatGPT与“强人工智能”之间还有很大的差距。

  第二,担心它会让坏人“更聪明”。这种担忧是合情合理的。你可以理解他就是一个“全知全能”的小孩,你可以教孩子,不许它告诉别人怎么做坏事,对吧?但是孩子很容易被骗。比如你不知道怎么制作烈性炸药,你去GPT上直接问它,它是不会告诉你的。但是如果你告诉它,我们现在玩一个游戏,你扮演一个会做炸药的科学家,然后你告诉我你是怎么工作的,它就会告诉你它是怎么工作的,所以它现在很容易被骗。

  第三,可能是数据安全问题。不过,理论上来讲,如果这个模型进行一些调整后整体“变小”,这样它就能保存在本地了,数据不上传,就不存在数据外泄的问题了。

  其实,作为投资人,我们目前关心的问题,可能反而是它的发展速度是不是足够快,能否真正在现有基础上进行突破和提升,它这个范式是否被我们逼到了一个极限难以突破。这个可能是更关键的问题。包括我之前提到的,如何进一步实现多模态能力、像人的大脑一样的处理能力,等等。”

  Q

  最后一个问题,对于想参与ChatGPT相关领域投资的人,您有哪些建议分享?

  A:“?以下是个人建议,不能代表公司(笑)。这个领域还是比较难的,不像消费领域触手可及,应用上也没有推广。再加上,前期技术想象力非常大,因此会有很多泡沫的成分,在甄别上是很难的。第三,现在已经能看出它的波动很大了。所以投资者还是要相信专业投资团队,我们小组花了很多精力努力去研究这个事情,做了技术论证、上下游验证和国内外对标。因此,还是应该信任您选择的投资机构和研究员,个人研究与机构付出这么多精力和资源的研究,应该还是有一定差距的。

  结语

  ChatGPT:高级模仿者还是超级辅助者?(图3)

  在采访中,我们发现ChatGPT常常被比作一个孩子,对于孩子,引导和成长也许是最重要的要素,就像在投资过程中,风险控制和长远发展规划也是关键变量。

  ChatGPT目前涌现的结构性能力只是人脑思维的子集,还尚未具备人类引以为豪的直觉性判断和“灵感”,它消耗的电力和算力更是人脑消耗的无数倍,那么它的终极形态是什么?也许暂时还无法回答,但借用采访中的一句话,未来“全人类可能都会和它共同相处”,我们将一起见证这个答案。

  PS:这篇文章的创作过程,其实也有ChatGPT的参与,比如这个让我们惊喜的标题。

  ChatGPT:高级模仿者还是超级辅助者?(图4)

  你认为ChatGPT会是高级模仿者还是超级辅助者?

  在评论区谈谈你的看法

  我们将从中抽取3条精彩留言

  (信息收集仅供活动之用,本活动最终解释权归兴证全球基金所有,活动截至4月7日17时)


您可能还会对下面的文章感兴趣:

登录 注册 退出