嗨ChatGPT，人类对你最好奇的是什么呢？这篇文章一一解答！丨智言智语

2023-02-15

　　编者按: 智显未来，洞见新知。中科院之声与中国科学院自动化研究所联合开设“智言智语”科普专栏，为你介绍人工智能相关知识与故事，从最新成果到背后趣闻，带你徜徉AI空间，看人工智能如何唤醒万物，让世界变得更美好。

　　在过去的一段时间里，ChatGPT受到了全世界人们热烈的关注和讨论。来自各行各业的使用者们或对以此为代表的人工智能技术发展振奋不已，或开始了一场关于人工智能的严肃思考。

　　关于ChatGPT的智能原理、对于人类社会可能产生的影响以及未来的可能性，你是否也还有很多问号？抛开噱头，本文将从几大问题出发带你科学、深入地了解ChatGPT，迎接人工智能与社会发展的更多可能。

　　首先，如果我们问问ChatGPT，人类对你最好奇的是哪些问题，它会做出怎样的“自我审视”呢？

　　它是否真的很厉害？有时候是不是很奇怪？是不是真的很智能？是否很有趣？

　　【好奇一：它是否真的很厉害？】

　　Q1：ChatGPT可以出色完成多少有难度的任务？

　　ChatGPT是基于人类反馈的强化学习（RLHF）和大规模预训练语言模型（LLM）结合的集成之作，通过 “模仿学习+强化学习”学习范式最终表现出非常通用且强大的自然语言处理能力，不仅可以与用户针对任意话题进行高质量的对话和闲聊，而且可以准确地按照用户意图实现分类、问答、摘要和创作等若干应用场景的自然语言理解与生成任务，快速形成具备基本逻辑的回答，甚至可以撰写行业报告等。

　　Q2：ChatGPT厉害到有可能取代部分职业吗？

　　ChatGPT本质上是一种基于上文预测下文的大规模语言模型，主要具备问答、对话、文档概括、文本创作等能力，有可能影响多个领域，比如基础的客服行业、归纳性的文字工作者、动画建模师、美工师、翻译师、低级代码开发人员以及提供基础咨询服务的行业等。可以预想，创造性较低且基于大量行业知识或训练就可以完成的工作会受到更大的冲击。

　　未来10年是认知智能的10年，AI能帮人类做的事情会越来越多，很多领域都将存在这种代替或辅助，但在目前，大家也不用恐慌。ChatGPT展现的语言智能只是认知智能冰山一角。这种技术革新，目前还只是语言维度，有一定的局限性。它还没有产生意识，更多的是帮人类做概括总结归纳，做一些知识的推理、写代码，这是一种通用的基础能力，但想要对人类有更加深刻、全面的理解，比如复杂的眼神、动作、表情等等，还有很长的路要走。

　　【好奇二：它有时候很奇怪？】

　　Q3：为什么它的回答有时候很奇怪？（为什么ChatGPT的回答有时候违背事实？）

　　虽然已经非常惊艳，但ChatGPT仍然存在着一些问题。比如在常识问题处理方面，ChatGPT缺乏常识驱动，难以突破复杂问题理解的瓶颈。由于基于海量互联网数据的生成式模型，在生成过程中存在一些张冠李戴的问题，同时过分估计人类的意图，当用户意图不明确时，很大概率给出不合适的回复。它通常过度使用一些常见的短语和固定句式模板，部分回复废话较多。当然，这与构造训练数据时，用户倾向于选择更长的回复有关。

　　Q4：小学生擅长的鸡兔同笼问题，为什么难倒了会写大学论文的ChatGPT？

　　ChatGPT经过了大量数学题库的逻辑训练，所以能够求解相当多的数学问题。但似乎它只学习到了推理的基本模式，而并未学习到推理的核心本质。作为生成式的大模型，在鸡兔同笼这样对人来说比较简单的数学问题上，ChatGPT即使列对了鸡兔同笼的方案，也难免产生错误的推理结果。

　　Q5：它真的可以像人一样沟通交流吗？

　　就目前来看，ChatGPT虽然展现了前所未有的强大功能，但离完全取代人工还有一定距离。首先，在多模态感认知方面，ChatGPT仅利用文本这一单模态数据，只能进行文本对话，难以适配真实世界的多模态对话场景；另外在常识问题处理方面，ChatGPT缺乏世界知识的驱动，难以突破常识问题理解的瓶颈。

　　并且，ChatGPT缺乏人类的生活体验，还无法真正理解世界和人类，没有鲜明的感情与个性。

　　【好奇三：它是否真的很智能？】

　　Q6：它的工作原理是什么？是直接复制信息吗？

　　ChatGPT的工作原理是利用GPT-3.5模型的世界知识建模、上下文学习和通用语言生成能力，通过在人工标注的高质量对话指令数据上监督式训练对话生成模型和对话质量评估模型，进而利用强化学习不断调优对话生成策略，实现了与人类意图相对齐的对话生成能力。

　　具体而言，基于GPT-3.5基础模型，ChatGPT首先通过收集的全球用户的真实问题，在人工标注的问答和对话数据基础上作为监督数据，对GPT-3.5基础模型进行微调，得到初步的ChatGPT模型；以此为基础，接着针对每个问题生成多个候选答案并进行人工排序，根据排序结果训练奖励模型；之后再基于强化学习方法利用奖励模型对ChatGPT模型再次进行微调，即在微调过程中让ChatGPT的回复使得奖励模型的得分最高。而优化后的ChatGPT模型又可以重复前面的“模仿学习+强化学习”步骤，不断优化ChatGPT，从而得到性能最优的通用人机对话模型。这样一来，不仅可以与用户针对任意话题进行高质量的对话和闲聊，而且可以准确地按照用户意图实现分类、问答、摘要和创作等若干应用场景的自然语言理解与生成任务。

　　Q7：可以说这是一项变革性的技术吗？

　　过去几年类ChatGPT技术已经得到深入研究，ChatGPT通过产品方式展现在大众面前。但ChatGPT的突然爆火意味着人机交互走出了技术深闺，标志着以大模型为核心的智能计算范式的确立，敲开了通用化人工智能大门。近年来，以GPT-3、ChatGPT为代表的大模型技术所取得的显著成果表明，增大模型规模和数据规模是突破现有人工智能技术应用瓶颈行之有效的方法。ChatGPT的成功标志着从以专用小模型训练为主的“手工作坊时代”到以通用大模型预训练为主的“工业化时代”的人工智能研究范式转变。

　　这一转变具有十分重要的意义。通过先进的算法架构、可能多的数据，汇集大量算力，集约化的训练模式，由此得到的通用大模型可在广泛应用场景下通过极低代价的模型微调实现高性能的任务适配，使人工智能技术的先进能力更好、更有效地应用到各个场景里面，从而大大降低开发成本，加速产业发展。ChatGPT的出现为人工智能产业注入了新的活力，同时也极大促进了通用化人工智能的发展。

　　Q8：ChatGPT的爆火，将如何影响未来全球人工智能领域的发展方向？

　　ChatGPT在实现通用化人工智能的道路上迈出了坚实的一步。未来，可以期待我们在知识推理、多模态感认知和基于真实环境的认知决策方面产生新的突破。

　　首先是多模态通用人机对话模型。从婴幼儿开始，人类就是在图、文、音等多模态的环境中通过交互的方式实现认知和学习，因此，通用文本对话模型必将进阶到通用多模态对话模型。突破单模态和两模态，实现图、文、音等更多模态的通用人机对话模型是人工智能融入现实世界的必然。基于多模态大模型“紫东太初”，中科院自动化所正在进行新的尝试。

　　其次是连接现实世界的认知决策模型。多模态通用人机对话模型实现了对真实世界的感认知，但是决策是通用人工智能的终极目标。如何让智能体具有从感知、认知到决策的一体化能力是未来的重要研究趋势。目前OpenAI、DeepMind等公司一方面研究面向感认知的通用大模型技术，一方面研究面向真实环境决策的强化学习和多智能体技术，未来两个方向的融合必将产生新的突破性成果。

　　【好奇四：它是不是有趣的机器人】

　　Q9：它能生成有趣的对话吗？

　　它可以根据人们的提问生成多种风格的文字！ChatGPT基于海量数据训练的生成式大规模语言模型GPT3.5作为基座，能够对世界知识进行建模和编码，同时结合大量监督的问题回答和人类反馈的学习，实现了ChatGPT从命令驱动转向了意图驱动，从而能按照人类的引导来估计人的意图，生成有趣的对话。

　　无论如何，在通往未来智能世界的道路上，ChatGPT写下了精彩的一笔，也点亮了更多的可能。人工智能研究离终极目标还有很远的距离，但人类正在朝着它光明前景的快速道上大步前进！

　　本文观点整理自中国科学院自动化研究所王金桥研究员

　　来源：中国科学院自动化研究所

　　本账号稿件默认开启微信“快捷转载”

　　转载请注明出处

　　其他渠道转载请联系 weibo@cashq.ac.cn

<<数据安全观察｜ChatGPT潜在数据保护风险分析及建议【走出去智库】

第一批因ChatGPT坐牢的人，已经上路了>>

嗨ChatGPT，人类对你最好奇的是什么呢？这篇文章一一解答！丨智言智语

您可能还会对下面的文章感兴趣：

随便看看