专访清华大学副教授杜明芳：国内科技企业应抓住ChatGPT这场生成式AI的浪潮与契机｜

2023-02-27

　　杜明芳是清华大学副教授、研究员，工学博士（控制科学与工程专业人工智能方向），从事智慧城市、产业互联网等领域研究，同时对科技界新概念新技术都有自己的观察与见解。近日，本报记者采访了杜明芳副教授，围绕时下火爆的ChatGPT话题展开探讨，杜明芳也对ChatGPT中国化等问题阐述了自己的看法。

　　专访清华大学副教授杜明芳：国内科技企业应抓住ChatGPT这场生成式AI的浪潮与契机｜(图1)

　　本报记者：很多人将ChatGPT与Siri放在一起做比较，您认为它们之间有什么共性和不同？

　　杜明芳：Siri技术来源于美国国防部高级研究规划局的CALO计划——一个让军方简化处理事务的数字助理。所衍生出的民用版软件Siri（虚拟个人助理）最初以文字聊天服务为主，后来实现了语音识别功能。通过自然语言输入和自然语言理解，Siri可以调用系统内的资料搜索等应用程序，实现以语音识别为入口的智能化应用。

　　ChatGPT是美国OpenAI公司研发的产品，于2022年11月发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过学习和理解人类语言进行人机对话，还可以根据聊天的上下文进行互动，甚至能完成撰写邮件、写文案、写代码、写论文、写视频脚本、翻译文章等任务。

　　两者都是人工智能技术驱动的聊天机器人。不同之处是：Siri更多用在手机、平板等智能终端，通过语音识别再去关联其它智能程序，而ChatGPT并不局限于智能终端应用，它是一种更加基础更加通用的自然语言处理工具，只要有语言AI处理的需求，它便可以通过调用底层算法模型结合场景开发和实现应用程序。从底层数学模型方面看，ChatGPT的训练模型、机器学习算法在不断的调整和升级之中，最新算法中已经引入了强化学习，Siri采用的数学模型与此有所区别，所以二者的基础模型也有所不同。

　　本报记者：ChatGPT目前已经能够从事编辑文本、写代码等简单工作，这是否意味着伴随ChatGPT的不断成熟，很多人工岗位将被取代？例如程序员基础岗或者媒体行业的一些基础写作岗位？

　　杜明芳：有这种可能性，尤其对在一些事务处理比较固定化、程式化的岗位，ChatGPT取代人的可能性很大，但不能完全取代，仍需要人类的辅助。在一些需要行业经验，专业知识，人类特有经验、知识、灵感、顿悟的领域，我认为至少未来5年内ChatGPT还不能够取代人类，这是因为在综合创新性和应对复杂不确定性方面，人工智能还远比不上人类智慧。ChatGPT等人工智能技术对工作岗位的影响，我们应该有清晰的认识，即：人工智能将人类从重复性、繁重性、危险性的岗位上解放出来，目标是使人类能够腾出更多时间精力去从事更有价值的工作，并不是让人失业。人工智能在取代了一部分工作岗位后，随之又创造了新的工作岗位、新的职业工种。从历史发展的长远视角来看，这是社会、产业形态不断迭代更新、螺旋上升的必然趋势，否则就不会有人类文明的不断发展演进。

　　本报记者：现在业内普遍看好ChatGPT的发展前景，其用户量也在不断增加，甚至有人预测ChatGPT将重塑互联网生态，对此您有什么看法？

　　杜明芳：由于采用开源共创共享的发展模式，ChatGPT吸引了大量互联网用户。但应清醒地认识到，ChatGPT仅仅是一种自然语言处理工具，属于人工智能理论和技术的一个分支，因此并不能涵盖人工智能的全部，也不可能凭借这一类技术就重塑互联网生态。毕竟，互联网生态是一个很大的概念，涉及众多技术、人、内容，不是一两个技术就可以重塑的。

　　本报记者：继发布ChatGPT后，近期OpenAI又推出了一款“AI分类器”工具，用来预防有可能发生的自动虚假信息宣传、使用AI工具进行学术欺诈以及将AI聊天机器人定位为人类等问题。这也引起一些业内人士的担忧，一旦预防AI工具犯错的技术落后于其优化的进程，很可能会出现失控的局面。对此，您怎么看？

　　杜明芳：人工智能算法系统具有两个发展脉络，一个是正面路线，它使物理系统实现更加智能化的功能，如通过AI算法实现预测、分类等；另一个是反面路线，用于对抗不正常信息或状态，如采用AI鉴别、AI过滤、AI诊断等技术手段来实现系统智能的完善性、鲁棒性（编者注：鲁棒，Robust的音译，健壮和强壮的意思。它也是在异常和危险情况下系统生存的能力。）、可信性。这两个发展脉络并不互相矛盾，只要技术方面控制好，两者可以达到互相支撑和互相支持的效果。OpenAI推出的用来预防发布虚假信息及犯错的工具是为了促进其产品ChatGPT的健壮性和伦理性，并不会出现所谓的失控局面。

　　本报记者：国内科技企业在类ChatGPT产品研发方面与美国科技企业有多大差距？中国的头部科技企业真正抓住这场生成式AI浪潮了吗？未来如何实现良性发展？

　　杜明芳：国内科技企业在类似ChatGPT人工智能研发方面与美国科技企业仍存在差距，如果从科技基础来判断，至少有10年的差距。在人工智能基础理论、算法模型的构建、发明及创造性应用方面，我国科技企业的表现明显不如美国企业。这是造成差距的根源所在。从产业链的角度来分析，我国科技企业更多处于人工智能产业链的中下游，而美国科技企业普遍盘踞于产业链上游。

　　中国头部科技企业应抓住这场生成式AI的浪潮与契机，从以下三方面多措并举快速推进企业发展：一、应在新型AI算法模型研究方面加大基础科研力度，在底层数学理论支撑、物理理论支撑及其与工程模型的打通方面多下功夫，使数理理论与工程理论更好地衔接起来，产生这个环节上的交叉创新；二、应积极思考、布局、开发自己的知识产权体系，在专利、标准、著作、论文等多个方向上围绕企业的主业不断拓展和突破，形成企业特色的知识产权池，为企业长期发展提供智慧支持；三、应认真思考企业聚焦的行业领域，将人工智能工具与从业领域融合，积极探索应用需求驱动的生成式人工智能及其他人工智能方法的创新点，不断创新人工智能应用。

　　本报记者：ChatGPT衍生自GPT-3.5。GPT-3.5和GPT-3.0、GPT-4.0的区别有哪些？有消息称，GPT-4.0已经通过图灵测试，在您看来，GPT-4会带来怎样的变化?未来，它可以像人一样思考吗？

　　杜明芳：GPT-3.5和GPT-3.0、GPT-4.0的区别体现在以下5个方面：数据标注的人工参与程度、参与模型训练的参数量、参与模型训练的数据量、策略闭环优化程度、生成内容的质量。随着算法模型等级的提升，总体趋势是：人工参与标注的成分降低，参与模型训练的参数量和数据量上升，策略闭环优化能力不断加强，生成内容的质量越来越高。例如：2022年底发布的ChatGPT的参数量可达千亿级、数据量可达百T级，采用闭环的PPO（Proximal Policy Optimization，近端策略优化）强化学习来优化系统策略。

　　理论方面，GPT-4.0将会在大模型机器学习、语言模型、复杂大系统建模、复杂大系统机器学习等方面起到积极的推动作用，将为人工智能系统的建模、仿真及基础理论体系的完善提供一种新方案；应用方面，GPT-4.0将在对话生成系统、AI问答系统、AI写作、AI绘画等方面创造众多新的产业领域，助力新产业新经济发展。

　　未来，至少5~10年内，我认为GPT-X（X代表3.0、3.5、4.0及以后更高版本号）技术尚不能完全像人类一样思考。目前GPT-X技术存在的瓶颈主要有：很难精准理解人类意图，尚不能完全脱离人类经验的指导（数据标注较大程度上要依赖于人），无模型GPT机器学习算法很难被开发实现，无法像人类一样用感觉评价AI生成内容的质量及符合人类意图与偏好的程度。这些技术瓶颈不突破，就很难使GPT-X具备人类思维能力。

　　特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

<<零壹日报：华为彭松称“新一轮AI大爆发正在发生”；花旗、高盛等大行对ChatGPT说“

美国部分企业引入ChatGPT代替员工｜美国>>

专访清华大学副教授杜明芳：国内科技企业应抓住ChatGPT这场生成式AI的浪潮与契机｜

您可能还会对下面的文章感兴趣：

随便看看