【解码ChatGPT ②】王国成:ChatGPT的言传与意会
编者按
2022年11月以来,美国人工智能研究公司OpenAI开发的聊天机器人ChatGPT,迅速成为史上增长最快的消费级应用程序,引发广泛关注。ChatGPT的出现成为人工智能发展的引爆点,推动各国科技创新竞争进入新赛道。技术的跨越必然带来应用场景中的深入观察,无论人工智能服务变得多聪明,适应与满足人类发展需要始終是根本指向。面向未来,多维度多视域探讨 ChatGPT对人的生产方式、生活方式、思维方式、行为模式、价值观念以及对产业革命和学术研究等的重要影响,有助于我们正确使用和管理这种技术,进而思考人工智能的发展前景。
ChatGPT自2022年11月问世以来,大大超出人类写作的平均水平预期,迅速火爆升温,注册用户上亿,引发谷歌、百度等数千亿产业投资,无疑是AIGC(人工智能生成内容)和NLP(自然语言处理)领域的一大进步。但是从某种意义上说,其价值取向、服务目的、技术进步、推广应用和发展规划等尚极其受限,需要深度思考。
技术突破
ChatGPT的基本原理与核心技术,是基于统计方法的监督式深度(强化)机器学习,属于AIGC和NLP领域,无论是技术上还是应用上都极具潜力,被Science杂志评选为2022年度十大科学突破之一。ChatGPT的出现,使AIGC强化了内容与生产力的连接,大大推进了NLP的研究进展。
推进NLP的技术转向和研究范式的变革。ChatGPT迅速走红,其实是自回归类语言模型的一次翻身仗。近年来,NLP领域对Transformer思想产生的大型预训练模型,从双向语言模型对自然语言的理解,到以自回归语言模型(按语序),更多地应用于自然语言生成任务,ChatGPT的强大能力让自回归语言模型一样能达到甚至赶超双向语言模型,甚至在未来有可能实现统一理解、生成两类任务。
实现LLM(Large Language Model,大型语言模型)交互接口的革新。ChatGPT的最大贡献是几乎实现了理想的LLM交互接口,让LLM适配人的习惯命令表达方式,而不是反过来让人去适配LLM,从而提升了易用性和用户体验。这必将启发后续的LLM模型在易用人机接口方面做进一步的工作,让LLM更听话,使LLM技术体系囊括NLP外的更多领域。ChatGPT最突出的特点是“能力强大,善解人意”。巨量语料、算力的结晶,使模型蕴含的知识几乎覆盖了各个领域;其训练过程中加入了“人类偏好”的人工标注数据,能够理解人的命令,表露出一些“人味”。
强化Transformer整体功能。相比较而言,ChatGPT是应用功能增强型的,而元宇宙是整体建构型的。ChatGPT的核心技术和关键支撑,是由最后一个字母T(即Transformer)的基本含义和主要功能强化连接、传输、转换和调适等来体现的,借此可跨域跨科、适应于不同应用主体和设施。于是,人类语言覆盖的所有领域,都有可能放在同一平台上进行信息和数据的自动化智能化处理。
投入成本巨大。目前,ChatGPT应用的RLHF技术(基于人类反馈的强化学习),需要拥有3000亿以上单词的语料基础、1750亿个参数的模型;若要训练图形保证误差率在5%以下,就需要1000亿美元左右的投入。这说明AIGC类技术的进展艰难、缓慢,且成本巨大。类似的Google LaMDA、Bard、YouChat和Perplexity AI等,机器与人对话或文本、或语音,间或附以图景画面等形式,都只是多“能”而少“智”,虽然在提高规模、速度、效率和精准的功能方面有显著进步,但在与人类互激共进方面还很“Low”,远不如人意。
应用空间
ChatGPT的出现及相应的产业化商业化落地,将会为从UGC(用户创作)到AIGC的转型提供关键支持,有望加速写作助手、对谈系统、智能客服、代码开发等领域的商业化进程,无疑会赋能造势、推动AI领域打开更广阔的应用空间。
引发投资、产业和市场应用。对大多资本与科技巨头来说,密切关注和入局ChatGPT赛道,无疑是看中了技术背后的市场空间,如在跨境电商、游戏开发、企业管理、数字化转型和教育等领域,以及现代高科技生活方式方面的应用。以生成式问答为主体,结合现有的NLP、个性化搜索引擎和知识图谱等,综合考虑用户个性化需求和购物特点与习惯的提示词标注、知识结构等进行应对用户问题的内容生成和展示,可以在技术上实现完整一致的搜索体验。
促进数智治理和数字政府建设转型。ChatGPT无疑能强有力地推动政府部门运用各类数字技术促进经济调节、社会管理和公共服务等职能环节实现数字化转型。例如,将ChatGPT用于公共服务体系建设,有助于关切微观主体,全方位获取用户的需求和偏好,提升公共政策的执行效率;提供决策相关的各类数据,获得多种可供选择的政策方案,加速推进政府决策的智能化和科学化;公务员从繁重的文稿准备工作中解放出来,加强信息搜索和文书加工合成能力。
助力人文社会科学研究。对学术研究领域,ChatGPT无疑是很好的“助手”,它能整合和输出既有文本、辅助创新和生成新的观点与想法。有效利用ChatGPT超强的数据挖掘/爬虫/获取和文本分析处理能力,收集更多以前无法获得的数据,有望突破现有学科壁垒,对跨学科交叉融合、新文科等新学科建设起着重要的助推作用。
辅助改善日常生活。在日常生活中使用ChatGPT可加快完成常规任务,减少重复性劳动,提升生活质量;检测网络设备的安全漏洞隐患,增强系统安全性;加快物智互联和物流效率,加强实时控制管理;实时监测和评估人们的身体状况,及时提供改善和保障健康建议;普及数字知识、技能和应用,充分利用大数据与人工智能技术提高生活便利和幸福感。然而,ChatGPT也会引发社会规则演变和科技伦理方面以及收入分配和公平问题,需要及时防范。
发展前景
目前,ChatGPT还是定位在语言处理的言传,对类意会式表达还不能结合语境进行全面的语义分解和选定。在很多条件下,人类的交流却只可意会、不可言传,尽管ChatGPT也涉足诗歌、书法和绘画,但对人的眼神、表情、手势和肢体语言,借景寓意、图形可视化可编辑、情景动画创作等领域,还基本上无能为力,要逐步完成言传—图景—意会的“三级跳”才行。
基于有监督的深度(增强型)机器学习,ChatGPT已经成为NLP的重要一环和新的突破,并将对NLP领域产生重大影响。它能更准确地预测文本序列的概率,根据上下文内容意境自动生成文本,为NLP研究带来更多机会和提供更多便利;构建更复杂的NLP系统,从而逐步完成语言、图景和意会不同层次阶段的多向连通和无损转换的自动化、智能化处理。
总的来看,人类与机器的分工与边界还是比较明确的。我们既要看到ChatGPT的省时省工高效,还要看到它依然停留在规定动作,基于统计平均得出的共性尚难以刻画和满足个性化需求,在人类智慧和创造性方面更乏善可陈。所以,不必担心ChatGPT会对人类工作的大量替代,它只是处在辅助和在某些方面并行的地步。
纪伯伦说,思想是天空中的鸟,在语言的笼里,也许会展翼,却不会飞翔。ChatGPT乘风而来、倏然而至,本质上乃是人类探索和追逐AI新技术应用的脚步从未停歇。唯有突破原理认知、相关技术和算力成本约束等,ChatGPT的言传或可实现属人的意会,激发智慧,创造美好的未来。这应该是AI等未来发展的重要方向和科技向善之路。
作者系中国社会科学院数量经济与技术经济研究所研究员、中国社会科学院大学计算社会科学研究中心主任
来源:中国社会科学报
责任编辑:班晓悦
新媒体编辑:张雨楠 翁腾月(实习)
历史阅读
点个“在看”不失联