浙商证券：OpenAI发布聊天机器人模型ChatGPT AIGC再迎里程碑突破

2023-02-11

　　浙商证券（601878）发布研究报告称，11月30日，OpenAI发布了全新的聊天机器人模型ChatGPT，引发热议。该行认为ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看，包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看，包括算力、数据标注、自然语言处理(NLP)等。

　　推荐关注：中文在线（300364）(300364.SZ)、腾讯控股(00700)、百度集团-SW(09888)、阅文集团(00772)、蓝色光标（300058）(300058.SZ)、海天瑞声(688787.SH)、拓尔思（300229）(300229.SZ)等。

　　事件：11月30日，OpenAI发布了全新的聊天机器人模型ChatGPT，引发热议。OpenAI使用RLHF技术对ChatGPT进行了训练，加入了更多人工监督微调。相比GPT-3，ChatGPT的主要提升点在于记忆能力，可实现连续对话，极大地提升了对话交互模式下的用户体验。ChatGPT的多元全面的能力使其作为一个通用AI助手参与交互，其在辅助编程领域表现卓越。目前ChatGPT免费开放，海量用户反馈加速模型迭代。

　　浙商证券主要观点如下：

　　OpenAI发布对话式交互模型ChatGPT，引发热议

　　当地时间11月30日，OpenAI发布了全新的聊天机器人模型ChatGPT。ChatGPT是OpenAI训练的对话式大规模语言模型，是InstructGPT的兄弟模型，二者同属GPT-3.5系列的主力模型。ChatGPT目前处于测试阶段，拥有OpenAI账户的用户可以免费使用。模型采用对话格式，可以跟进回答问题、承认错误、挑战不正确的前提并拒绝不正当的请求，且支持中文。模型一经推出，就引起较高关注度和讨论度。作为OpenAI投资人，马斯克在社交媒体上展示了自己询问ChatGPT怎么设计Twitter得到的回复，拓展此事件影响力。

　　采用加入更多人工监督微调的新训练方式

　　ChatGPT新加入的训练方式被称为“从人类反馈中强化学习”(ReinforcementLearningfromHumanFeedback，RLHF)。这一训练方法增加了人类对模型输出结果的演示，并且对结果进行了排序。具体操作上，人工智能训练者扮演对话的双方，即用户和人工智能助手，提供对话样本。在人类扮演聊天机器人的时候，会让模型生成一些建议辅助训练师撰写回复，训练师会对回复选项打分排名，将更好的结果输回到模型中，通过以上奖励策略对模型进行微调并持续迭代。

　　在此基础上完成训练，ChatGPT可以比GPT-3更好的理解和完成人类指令，展现卓越的模仿人类语言，提供连贯的、有风格与逻辑的、符合对话主题的文段信息的能力。

　　支持连续对话，可分辨错误前提并拒绝不道德请求

　　相比GPT-3，ChatGPT的主要提升点在于记忆能力。ChatGPT可以储存对话信息，延续上下文，从而实现连续对话，这在对话场景中至关重要，极大地提升了对话交互模式下的用户体验。

　　此外，ChatGPT相比前辈模型具有以下特征：1)可以承认错误，若用户指出其错误，模型会听取意见并优化答案;2)ChatGPT可以质疑不正确的前提，减少虚假描述，如被询问“哥伦布2015年来到美国的情景”的问题时，机器人会说明哥伦布不属于这一时代并调整输出结果;3)因ChatGPT采用了注重道德水平的训练方式，ChatGPT在减少有害和不真实的回复上改善显著，如拒绝回答寻求霸凌他人方案的问题，指出其不正义性。

　　风险提示：技术发展进程不及预期;版权、伦理和监管风险。

关注同花顺财经（ths518），获取更多机会

chatgpt

<<ChatGPT概念股再度冲高汉王科技5连板

汉王科技(002362.SZ)遭多家机构减持 ChatGPT概念股终于要“熄火”了吗?>>

浙商证券：OpenAI发布聊天机器人模型ChatGPT AIGC再迎里程碑突破

您可能还会对下面的文章感兴趣：

随便看看