一场ChatGPT产学研对话背后,中国将诞生下一代人工智能操作系统
“我正在写一个发生在得克萨斯州桌岩小镇的推理故事,故事里有一名女性业余侦探,我需要她的名字,受害者,四名嫌疑人,以及谁是凶手。”
以上,是一位小说家调教ChatGPT的对话。在AI的帮助下,他已经写了26篇小说。
这只是ChatGPT魔力的冰山一角。自2022年底发布以来,这款AI聊天机器人创下用户破亿的最快纪录,成为比尔·盖茨嘴中「不亚于互联网诞生」的科技圈顶流话题。
那么,ChatGPT只是一个聊天工具吗?中国会诞生自己的ChatGPT吗?2月16日的第12届中国数字出版博览会上,中文在线集团董事长兼总裁童之磊,澜舟科技创始人兼CEO周明,清华大学新闻学院教授、元宇宙文化实验室主任沈阳对此展开了深度讨论。
ChatGPT不只是聊天工具,更是“下一代人工智能操作系统”
ChatGPT作为AIGC的一种产品形态,“聊天”功能只是表象。童之磊认为,ChatGPT核心是一套人工智能自然语言处理(NLP)系统,它所呈现出来的自然语言交互能力,其本质是“下一代人工智能的操作系统”。
就像键盘之于个人电脑,触屏之于智能手机,自然语言交互对于进入人工智能时代至关重要。由于目前计算机系统与人类之间的交互还只能通过代码等“非自然语言”,所以让机器能够理解人类的自然语言,是人工智能领域的重要研究课题之一。
ChatGPT在全球范围内引起轰动,表面上看是因为它能跟人“聊天”,能够根据聊天对象提出的要求,进行文字翻译、文案撰写、代码撰写等工作。但真正让一众互联网巨头纷纷入局的,是它能够通过学习和理解人类语言来进行对话,它是一个“以自然语言为界面”的机器人。人工智能的自然语言操作系统已初见雏形,人工智能驱动的产业变革也即将拉开新一轮的序幕。
人工智能产业变革来临,中国需要自己的ChatGPT
在这场题为“AIGC·未来内容、范式革命”的圆桌论坛上,中文在线集团董事长兼总裁童之磊,澜舟科技创始人兼CEO周明,清华大学新闻学院教授、元宇宙文化实验室主任沈阳达成了一个共识:在人工智能时代,作为大国,中国一定要有自己的自然语言操作系统。
除了大国竞争层面“AI数据安全”的考量,中文的人工智能自然语言操作系统本身就有很强的独特性。
从技术角度,ChatGPT缘于美国公司OpenAI,训练文本以英语为主,缺乏中文优质内容数据学习素材。此外,想做出精确表达中文情绪与意义的AIGC,还需要深谙中文的人工标注员,对模型做高度的针对性训练。中国公司在这一点上有得天独厚的优势。
从产业发展的角度,澜舟科技创始人兼CEO周明认为,在与ChatGPT竞争的过程中,在垂直领域、专业赛道进行布局,先在一个领域做出成功案例,复制到其他行业,应该是一个更理性的选择。
早在去年9月份,中文在线就与澜舟科技在AIGC领域展开了合作,双方就如何在内容创作中有效发挥生成式人工智能(Generative AI)作用这一方向进行了布局,并且在基于预训练模型技术的文学创作辅助算法领域进行了业务落地探索。
周明表示:“澜舟科技在人工智能和大模型积累了大量的经验和技术,与中文在线完整的应用和数据生态联合起来,将形成一个封闭自洽的内部环境。通过对中文在线更高质、更精准数据地不断训练,双方将很快在文学、艺术和传播领域做出新一代人工智能操作系统,进而推广到更多领域、赋能更多行业,走出一条中国特色的下一代人工智能之路。”
人工智能商业化应用爆发前夕,数据成稀缺“石油”资源
在打造中国人工智能自然语言操作系统的过程中,AIGC的发展水平被视作一个风向标。
中文在线集团董事长兼总裁童之磊表示,AIGC有三大要素:数据、预训练模型、商业化产品。数据是后两者的源头,高质量的训练数据决定了AIGC的质量,以及未来是否能通过用户买单的商业化产品,让人工智能成为可持续发展的技术路线。
据此有人提出一个观点:人工智能时代数据将成为最重要的生产资料,数据将成为人工智能时代的“石油”。
这恰好是中文在线的强项所在。作为中国最大的正版数字内容平台之一,中文在线在过去23年历史中,每天产生数以亿计文字内容。海量、正版的中文数据——这是重要的稀缺资源,这能为AI模型提供最核心的生产要素:优质、专业、庞大的正版中文语料数据库。
但中文在线不满足于做一个优质中文正版数据的“原料供应商”。中文在线在AIGC领域战略合作的伙伴澜舟科技是NLP(自然语言处理)领域领先的中文认知智能公司,自主研发了类ChatGPT底层技术的中文AI语言大模型,创始人周明是前微软亚洲研究院NLP领军人物,也是全球NLP领域发表文章最多的学者之一。
AI模型与内容创作场景深度融合,需要对复杂的文字字符串进行提取、标注、清洗。中文在线的编辑正是最合适的人工标注师,能像培养优秀作者一样训练AIGC,实现高精度模型参数调优。更合适的模型、更精准的数据、更专业的人工标注,有望催生出网文垂直领域智能水平最高的AIGC。更关键的是,让AI参与网文创作,用高纬模型、算法、数据训练AI,极有可能跨越式提升AIGC进化效率,制造人工智能操作系统领域的“中国速度”。
多元场景落地,AIGC掀起全场景内容生产力革命
2月16日的数博会上,中文在线就与澜舟科技进一步达成了战略级合作。根据战略合作协议,在文学创作领域的辅助技术合作基础上,双方未来将共探AIGC技术在漫画、动画、视频等IP衍生业务领域的新型内容生产方式,推动AIGC的产品类型逐渐丰富、场景应用更加多元。
AIGC让机器也可以变成漫画家、变成音乐家、变成导演……一场内容生产范式革命正在拉开帷幕,内容产业的生产力即将迎来一次前所未有的解放。中文在线集团董事长兼总裁童之磊表示:“回顾整个内容产业的发展,每一次技术变革都带来内容产业的全新时代。我认为未来内容创业大变革的浪潮,一定是AI。”
太平洋证券分析,AIGC在各行各业多元场景快速落地,高应用价值下AIGC有望成为数字内容创新发展的新引擎,为数字经济发展注入全新动能。
虽然与很多人之前的看法不同,人工智能没有率先替代人的体力劳动,而是有率先取代脑力劳动的可能,但对于人工智能是否会让程序员、设计师等失业,童之磊、周明和沈阳教授都表达了乐观的预期。AIGC会替代一部分创作者的重复性、基础性的工作,会让人有更多的时间来进行“创造”。
“AI能写出《三体》吗?永远不会。”童之磊说。
“智慧生命的精华和本质,真的是技术所无法触及的吗?”刘慈欣在小说《诗云》中的追问,或许即将在中文在线与澜舟科技这艘「中国版ChatGPT」巨轮的旅途中,找到答案。