ChatGPT爆火,AI产业化进程加速|AI|中信证券|进程
本文来自格隆汇专栏:中信证券研究
主题
ChatGPT是人工智能研究实验室 OpenAI推出的一款基于AI的自然语言处理工具。ChatGPT使用的人类反馈强化模型技术使用人类偏好作为奖励信号来微调模型,能够通过学习和理解人类的语言进行对话,像人类一样聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
ChatGPT可被广泛应用于多领域,有望率先落地AIGC领域。我们认为ChatGPT中短期内产业化的方向主要分为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。
ChatGPT的成功,预示着人工智能(AI)无论在经济性与可获得性上都达到了支持普及的水平。同时,ChatGPT产生的鲶鱼效应,料将推动全球AI产业化进程的全面提速,以及AI生成内容时代的全面到来。
投资机会:对产业界AI的发展而言,数据质量的优化、AI研究人员的储备与计算能力将是未来能否走在AI应用前沿的核心能力。AI产业有望成为全球科技领域中期最具投资价值的产业赛道之一。AI产业有望继续保持“芯片+算力基础设施+AI框架&算法库+应用场景”的稳定产业价值链结构,拥有完整数据闭环结构、良好数据自处理能力的企业望持续成为产业受益者。以ChatGPT为代表的预训练大模型加速商业化落地,将带来大量算力需求,以政府为主导的城市智能计算中心AI算力卡国产化进度较快,建议关注华为昇腾生态圈核心厂商。ChatGPT等AI产业化的落地预计将进一步推动海外云巨头对于数据中心硬件设备的需求增长与技术升级,光模块、光芯片、光器件长期有望显著受益。另外,ChatGPT在金融科技领域的应用值得重点关注,超级生态和垂类平台都有机会。
ChatGPT是什么?
ChatGPT(Chat Generative Pre-trained Transformer,聊天生成式预训练器)是人工智能研究实验室 OpenAI推出的一款基于AI的自然语言处理工具。ChatGPT使用的人类反馈强化模型技术采用人类偏好作为奖励信号来微调模型,能够通过学习和理解人类的语言进行对话,还能根据聊天的上下文进行互动,真正像人类一样聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。
图1:ChatGPT图解
ChatGPT于2022年11月30日向社区发布测试,迅速获得极高的关注度。根据Similarweb的数据,ChatGPT在上线两个月不到的时间内就拥有了超过1000万DAU,MAU突破20万。目前ChatGPT是免费不限量向C端公众开放,并且OpenAI推出ChatGPT付费订阅版ChatGPT Plus,每月收费20美元,加速AIGC商业化进程。
图2:ChatGPT在上线仅两个月后预估DAU突破1000万
ChatGPT的技术逻辑:OpenAI团队从GPT-3.5系列中的一个模型进行微调,使用与 InstructGPT相同的方法,人类反馈强化学习(RLHF)训练该模型,并对数据收集设置相对做了优化。ChatGPT模型的训练过程主要分为三个部分:1)收集演示数据并训练有监督策略;2)收集比较数据并训练奖励模型;3)使用PPO强化学习算法针对奖励模型优化策略。
图3:ChatGPT模型的训练过程
资料来源:《ChatGPT发展历程、原理、技术架构详解和产业未来》(作者:陈巍 博士,收录于先进AI技术深度解读),陈巍谈芯@知乎,中信证券研究部
ChatGPT的中短期产业化落地
图4:ChatGPT应用领域广泛,有望率先落地AIGC领域
ChatGPT的出现以及中短期内的产业化落地将会为从用户创作(UGC)到AI创作(AIGC)的转型提供关键的辅助支持。结合ChatGPT的底层技术逻辑,我们认为ChatGPT中短期内产业化的方向主要分为四大板块:
1)文字模态的AIGC应用。ChatGPT在归纳性的文字类工作中展现出了极其优异的表现。中短期内ChatGPT能在办公辅助类工具中迅速落地,例如会议总结、文件翻译、例行报告等,提升办公效率并节省人力成本。
2)代码开发相关。2021年中与Github、微软合作上线的Copilot是目前最成熟的AI代码补全工具,ChatGPT在目前测试中表现出的代码生成能力相比于Copilot更加灵活,但欠缺一些底层的稳定性。在进行针对性的优化后,基于新GPT模型的AI代码辅助工具也有望在中短期内落地。
3)图像生成领域。图像生成领域成为了2022年下半年一级市场公司布局的热点,随着Dalle2的热度,在商稿方面用AI取代人类画手的思路基本明确。GPT模型在图像生成领域目前效果略逊于扩散模型,但扩散模型可以利用ChatGPT生成较佳的Prompt,对于AIGC内容和日趋火热的艺术创作,提供强大的文字形态的动力。
表1:国内主流AI绘画软件
4)智能客服。ChatGPT最适合直接落地的项目就是智能客服类的工作。根据模型现有的完成度,在垂直行业针对性的做人工反馈训练,ChatGPT就可以落地为智能客服产品,在to C场景中率先应用。对比目前的智能客服,ChatGPT支撑的客服将在灵活性与人性化服务方面有显著的进步。
图5:全球AI客服市场空间与增速(十亿美元)
另外,ChatGPT在内容深度搜索中的强势表现引发了市场对其是否能替代传统搜索引擎的争论。我们认为ChatGPT在中短期内无法完全取代传统搜索引擎,也较难改变当前全球搜索引擎市场竞争格局,但料将会加速搜索引擎演化进程,并在中期形成以传统搜索为主、ChatGPT类模型为辅的新搜索引擎形态,相应带来谷歌等传统搜索引擎巨头AI投入大幅增加。
图6:ChatGPT无法在中短期内取代传统搜索引擎
从ChatGPT看AI产业链投资机会
ChatGPT的成功,是在前期大量坚实的工作基础上实现的,不是横空出世的技术跨越。其证明了两点:1)单纯扩大模型参数并非唯一出路;2)让模型在早期开放给大众测试并收集人类反馈数据更有利于模型迭代。随着更新的技术、更优的算法、更大的模型出现,算力的成本越来越低,模型训练与运行所需成本持续下降,而算法从封闭测试到开放测试、开源的逐渐普及,亦降低了使用门槛。由此,人工智能(AI)无论在经济性与可获得性上都达到了支持普及的水平。
同时,ChatGPT产生的鲶鱼效应,料将推动全球AI产业化进程的全面提速,以及AI生成内容时代的全面到来。
图7:AI产业链发展的几个阶段
图8:AI产业价值链相关投资机会
?前瞻:ChatGPT模型的亮眼表现背后是研究者在Transformer模型前进的道路上发现了人类反馈强化学习这一方法带来的潜力,对产业界AI的发展而言,数据质量的优化、AI研究人员的储备与计算能力将是未来能否走在AI应用前沿的核心能力。AI产业有望继续保持“芯片+算力基础设施+AI框架&算法库+应用场景”的稳定产业价值链结构,拥有完整数据闭环结构、良好数据自处理能力的企业有望持续成为产业受益者。
计算机:ChatGPT是大模型商业化落地的标杆,其底层模型GPT-3共有1750亿参数,训练所需算力和成本均高出传统NLP模型,云算力资源训练成本估算约460万美金。大模型训练算力耗费巨大,算力扩容需求明确。以政府为主导的城市智能计算中心AI算力卡国产化进度较快,建议关注华为昇腾生态圈核心厂商。ChatGPT有望率先落地AIGC领域,推动AI领域公司商业化进程加速,中长期建议持续关注相关领域的AI公司:1)应用层;2)基础设施层。
通信:ChatGPT等AI产业化的落地需要云厂商庞大的算力支持,同时也需要算力成本与功耗的进一步降低。预计这将进一步推动海外云巨头对于数据中心硬件设备的需求增长与技术升级。目前光模块、光芯片、光器件、交换机作为云厂商硬件基础设施中必不可少的通信设备与元件。其速率提升与技术升级可以显著降低功耗,有望缓解算力成本与功耗过高这一阻碍AI产业化的问题。我们认为在全球科技巨头加大AI投入的背景下,相关算力上游核心环节将有望长期受益。
电子:我们测算单个大模型可带来2万GPU销售量,搜索引擎带来成倍空间。短期来看,对高端通用计算GPU的禁令可能会影响英伟达和AMD的GPU产品在中国的销售,中国AI计算、超级计算和云计算产业进步受到一定的阻碍;长期来看,国产CPU、GPU、AI芯片厂商受益于庞大的国内市场,叠加国内信创市场带来国产化需求增量,我们预期国内AI芯片的国产化比例将显著提升。对于国内厂商,建议重点关注实现自主创新,打造自主生态体系,打磨产品实现稳定供货的公司。
图9:ChatGPT对GPU算力的需求测算
资料来源:Raconteur,OpenAI:Language Models are Few-Shot Learners,NVIDIA官网,Amazon,中信证券研究部
金融科技:ChatGPT为用户交互体验大幅提升提供可能性,而用户交互是线上投顾的基础,投顾又是财富管理的核心痛点。因此ChatGPT在金融科技领域的应用值得重点关注。由于ChatGPT的核心包括数据、模型和算力,背后分别是规模、科技和资本,对于超级生态和垂类平台都有机会。
图10:ChatGPT影响金融科技的几个猜想
风险因素
ChatGPT相关AI核心技术发展、变现不及预期;科技领域政策监管持续收紧风险;核心芯片短缺风险;商业模式盈利困难风险;技术路径风险;
全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;地缘政治风险;全球云计算市场发展不及预期风险;
企业数据泄露、信息安全风险;行业竞争持续加剧风险;
美国政府限制英伟达、AMD出售高性能GPU导致算力受限;美国制裁导致OpenAI等公司拒绝向中国企业开放API;财富管理行业竞争加剧。
特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。