联想集团CTO芮勇谈ChatGPT：考虑将AIGC技术应用到产品和业务

2023-02-15

　　近日，围绕火爆全网的ChatGPT话题，联想集团CTO、高级副总裁芮勇博士接受了《中国计算机学会通讯》(CCCF)的专访，并分享了对ChatGPT等大模型的看法。芮勇表示，联想新IT架构将在AI新范式加速智能化变革的过程中继续发挥重要作用。除了基础架构之外，联想还在考虑AIGC技术在产品和业务里的应用。

　　从大模型到A

　　GI

　　还有多远？

　　ChatGPT是OpenAI GPT系列中为对话场景优化的语言模型，属于Foundation Models，即基础模型，简称为“大模型”。芮勇将它的特点概括为“一大三多”：一大是指参数规模大，是千亿参数级别的超大型人工智能模型；三多是指利用多来源、多模态、多任务的互联网规模海量数据进行训练。

　　芮勇认为，大模型首先在内容理解领域大获成功，例如BERT问世时刷新了11项自然语言理解任务的记录，最近又在内容生成领域取得了瞩目成就，也就是AIGC。

　　对于外界普遍关心的大模型是否催生了AI新范式，芮勇给出的答案是，简单来讲，AI范式的转变，是从“针对特定任务，更新预训练模型”(small models + fine-tuning)转换到“根据上下文提示自动理解并执行各类任务，无需更新模型参数或架构”(large models + in-context learning)。

　　ChatGPT的成功，让业界看到了由大模型通往AGI (通用人工智能) 的曙光，不过，芮勇认为，大模型能走多远，前景到底如何，是否能实现“多任务，多模态，多化身的大一统”，目前还颇有争议。

　　他进一步解释，近几年大模型有了突破式进展，很多人持乐观态度。从Gartner技术成熟度曲线可以看到，大模型目前处于“期望膨胀阶段”(Peak of Inflated Expectations) 。人们对它的期望很高，但也应该看到，大模型尚未解决的问题还很多。此外，对话机器人生成句子里包含的信息无法溯源，甚至包含偏向性和冒犯性言论等等。可见，通往AGI的道路还很漫长。

　　联想在大模型普及中发挥怎样的作用？

　　大模型的兴起，为进行智能化变革的企业带来了很多新的机遇。芮勇以联想为例进行了介绍。联想借鉴大模型背后的基础性算法，将小样本学习应用到基于计算机视觉的产品缺陷检测当中，提升了质检系统对新产品和新产线的快速迁移能力；此外，联想还将强化学习技术和人机协作的理念应用到供应链优化当中，使得供应链在剧烈变化的环境中，不断提升韧性。

　　对于联想将在AI新范式和大模型普及中发挥怎样的作用，芮勇表示，长远来看，很有可能AI新范式(large models + in-context learning)与旧范式(small models + fine-tune)共存，或是相互结合，而不会单个范式一统天下。联想将充分发挥“端-边-云-网-智”新IT架构的优势，来支撑新旧范式的结合与转换。联想提出的新IT架构，既致力于推动自身的智能化变革，也着眼于赋能各行各业的智能化转型。AI模型对运行环境需求越来越高，例如云-边-端的高度协同，异构计算与负载均衡、设备之间的互联互通、数据安全与隐私保护、模型本身的伸缩性与扩展性等等。联想在这些方面都有着深厚的技术积累，新IT架构在AI新范式加速智能化变革的过程中也会继续发挥重要作用。

　　除了基础架构之外，联想还在考虑AIGC技术在产品和业务里的应用。比如，在智能设备中对跨模态的生成模型进行优化和裁剪，使之能加载到手机或平板上实现个性化内容生成。在智能解决方案方面，我们考虑把AIGC用于新产品营销与新客户触达。目前，大模型还没有与知识有效结合，我们正在研究数据驱动与知识驱动相结合的方法，即Hybrid Learning来改进大模型的不足。另外，在大模型落地过程中，也需要彻底解决对环境变化或是新领域、新任务的自适应问题，即Adaptive Learning，这些都是联想人工智能的探索方向。

　　联想集团CTO芮勇谈ChatGPT：考虑将AIGC技术应用到产品和业务(图1)

<<民生证券：ChatGPT带动AI算力增长关注头部IDC运营商及IDC储能温控公司

氪星晚报｜科大讯飞副总裁刘聪：经过两个月验证，有信心实现ChatGPT类似的技术阶>>

联想集团CTO芮勇谈ChatGPT：考虑将AIGC技术应用到产品和业务

您可能还会对下面的文章感兴趣：

随便看看