港科大副校长:AI语料库里中文只有5%,如何打造ChatGPT中国版?
核心提要:
1.Open AI推出的聊天机器人ChatGPT爆火,不仅意味着人工智能从所谓“专用”走向“通用”,更展现了广阔的工业前景,无可阻挡地进入和改变着我们的生活。郭毅可认为ChatGPT的爆火源于它没有跟风,它的成功本质上是技术理想主义者的胜利。
2.Open AI的语料库里,中文只占5%,中国在这个领域大有可为。在生成性AI领域,中国也有自己的技术储备。我们更需要思考如何走出自己的技术道路;同时也需要具备技术理想主义的优秀人才,去好好开拓。
3.对于ChatGPT暴露出的问题和焦虑,郭毅可认为AI的飞速发展只会替代属于过去的人,不用进化的观点去讨论问题毫无意义。人机共处的社会中,人也要因机器的强化而强化自己。人在创造机器的同时,最主要是创造了自己。
各位网友好! 欢迎收看“香港號”,我是陈笺。 去年11月底,美国人工智慧研究实验室Open AI推出了一款聊天机器人ChatGPT,能用中、英文回答许多种问题,翻译、数学甚至是写程序,写词、曲、诗歌等都不是问题。 在界面上,它像“线上聊天室”,只是聊天的对象为AI,随便丢出任何问题,3、5秒后就可以提供五花八门的答案。 刚上线一周,就有超过百万名的使用者,现在每月的活跃用户更是超过了1亿。 ChatGPT的问世到底带来的是一场怎样的革命?人类担心自己的职业被取代有必要吗?未来世界,人的价值如何体现?相关话题今天陈笺请来人工智能专家,香港科技大学首席副校长郭毅可一起来探讨一下。
凤凰网香港號陈笺:郭校长,ChatGPT近期非常火爆,您作为人工智能专家,您认为它带来的是怎样的一次革命?
郭毅可:ChatGPT现在的确是一个全球热门话题。早在去年11月份它刚出来的时候,我就预感到这是一场风暴,它对人工智能发展可能是一个巨大冲击,其程度可能不亚于搜索引擎、互联网、web。
这里面我想有三个意义:
第一是从人工智能发展的角度。 它用完全不一样的技术使人工智能从所谓“专用的”人工智能走向“通用的”人工智能。以前的人工智能只是完成一项独立的任务,而今天的人工智能却具备了人所应具有的非常重要的基本功能,即语言和交流。
当年我们有个计算机叫“图灵”,通过图灵测试机器有没有智能。当人和机器回答问题的时候,实际上“图灵”就已经把问答作为一个测试智能的标准。其实今天的ChatGPT已经走向了这个方向,基本上能够通过图灵测试。相反,我们现在要考虑做反图灵测试了,我要去测试哪样东西是ChatGPT讲的,你看看这发展多快?
第二是商业上的。ChatGPT跟当年AlphaGo不一样,AlphaGo相对小众,只是一个下棋的功能;ChatGPT却可以为每个人所用,它是商业的机会。你看微软马上把它放到搜索引擎里去了,那么很多公司就会应运而生,用它作为一个核心的智能引擎。所以,从此展开一个宽广的人工智能的工业前景,因为以前普遍认为这个专业你做个视觉应用度很窄,现在就很宽广。
第三是社会意义上的。某种程度上ChatGPT生成了一种知识。比如我是做教育的就会有一个很大的悖论,如果学生用ChatGPT交了作业,我怎么算呢?比方说港大禁用它是个权宜之计,从长远来说它对我们提出了重大的要求,我怎么在这种情况下从事教育?我怎么让学生具有不同的知识,所以我觉得这个意义不可小觑。
凤凰网香港號陈笺:ChatGPT出现之后,大家在应用中发现它确实可以解答很多问题,尽管它给的答案会受提问者的立场观点影响。同时它也会带来新的问题,比如在教育领域它在写论文方面的功能就引起了高校的关注,您刚刚也提到了港大宣布禁用,如果用了视作抄袭;而新加坡政府却将它引入帮助公务员来提升效率。我们看到AI似乎是双刃剑,您认为我们如何才能让它有效地为人类所用呢?
郭毅可:我从来都是一个技术进步论者。我认为不能因为感到不适而阻止这种进步,这从来都不会成功。尽管我认为暂时对它有一些限制也是有道理的。因为我们需要时间重新审视、对它做一些规划。
但是从长远而言,ChatGPT将无可避免的进入我们的生活,所以我们必须要习惯。就像当年搜索引擎出来的时候,我们对于学生要找一个问题就赶紧搜很不以为然,但是今天百度一下谷歌一下是常态。所以我不觉得我们长此以往可以把它限制住,这是个伟大的技术。
我的学生在英国有个公司,他是做电子病历的,我就让他们做了个实验,我让ChatGPT诊断,结果ChatGPT做得非常漂亮。所以我最近要把试验报告写出来,大家可以看出它很可能成为医生的助手。同时当ChatGPT的判断和医生不一样的时候,它对医生是非常好的提示。所以,我们必须要认真地去思考在这个环境下面,我们的教育应该是什么样子?短期有一些措施可以理解,但从长远来讲,我们必须接受,这是一个技术革命。
凤凰网香港號陈笺:我非常认同您科学专业的观点。因为世界要进步,技术一定要不断提升。刚才您就说除写论文之外,当你需要一些数据信息的时候,它还也可以给你提供很好的分析。那ChatGPT问世之后,对谷歌等搜索引擎会造成致命打击吗?还有无论是谷歌或者百度,搜索的结果我们还是可以自己去判断和选择,但是ChatGPT它直接就生成一篇文章,会否有偏颇?怎样运用会更好呢?
郭毅可:首先我不觉得它对搜索引擎是一个颠覆,我比较正面的去看,搜索引擎很可能是它最好的一个用户,Bing就是最好的例子。
Bing本来不是第一流的搜索引擎,但现在搜索引擎的概念改变了,原来是搜索做菜的原料,现在是搜索一个做好的菜,对吧?那么搜索以后,我得到机器的回答是不是拿来就用了?这就是我们智力提升的一步。你知道机器来了,你正确的态度是怀疑、是debate、是ask。
我可以再举一个例子。最近我在香港科技大学做教务长,我们现在有个任务是要写校歌,写完以后是非常 elegant的中文,那么我们要把它翻译成英文。可是人的翻译总是体现不出英文的韵味来,所以我跟汪扬副校长最后就跟ChatGPT来做。我会跟它交流,这个地方不太好,这个地方不容易理解,而它也问我一些问题,结果我们翻出来相当漂亮。所以我觉得将来它是一个伙伴,是个工具。当然搜索引擎如果不去拥抱这个技术,那确实是个问题。
凤凰网香港號陈笺:刚才您就提到用AI来做艺术领域的创作,我记得去年你在浸会大学的时候就已经做过人机共创的交响乐团,您也分享过一些用AI做的油画等等。我想问的一个问题就是,其实作为艺术创作,它会涉及原创版权,比如说你们现在校歌生成了,你们在人机互动的过程当中达到理想的境界,这个版权归谁所有呢?
郭毅可:我觉得这个问题问得非常好。我们现在的校董会主席廖长城先生是个知识产权专家,我也常常要跟他去请教这个问题。这个问题很有趣的地方在于,ChatGPT是帮助了我,但最后选择是不是用、用哪句、哪句改过来,这是我们自己的选择。
我们必须给他一个credit,我们把它作为工具,我觉得知识产权一定是属于人的。就像你写篇文章用了纸笔,计算机,你不用说谢谢计算机,你也不必说知识产权属于计算机,这个道理我相信是差不多的,它是工具。
凤凰网香港號陈笺:对,刚才您又说到,ChatGPT的进步还是让我们看到,它不只是停留在某个领域中的使用,而是普通人都可以跟它交谈。我们也看到它的商业价值或者资本价值的提升,它的用户比其他所有的 App都增长得快。两个月的时间,它每月活跃用户就达到1亿了,据说估值也达到290亿美金。您如何看待国内外互联网公司开始跟风研发的现象?
郭毅可:我从来都是反对跟风的,因为我觉得ChatGPT之所以成功,就是因为它没有去跟别的风。因为我们知道语言内化系统是人工智能很难的课题,也是很难做到商业化的问题,但是我觉得Chatgpt本身恰恰就没有去这么做。
今天我看到我的师弟搜狗的王小川先生发了一个微信朋友圈,我觉得写得非常好,他就说”这是一个技术理想者的胜利”。所以ChatGPT能够取得成功是因为Open AI有个思想,就是Challenge通用人工智能。大家都说不可能的、都是哲学上的讨论,作为科学家就来挑战一下,我挑战,它就不是跟风了。所以你看Open AI成立的时候,它开始几年都快没饭吃了,对吧?后来微软有眼光投了10个亿,它就能成就今天。
所以我觉得跟风从来都不是创新的好方向,你要理解和建立自己的技术理想。现在ChatGPT已经开拓了通用人工智能的广阔领域,那么你就去想一想在这个领域里怎么去创造?ChatGPT是由1,750亿个参数组成的大模型,用耗电量这么大,涉及到改进空间巨大,有很多事情可以做。
凤凰网香港號陈笺:目前,大中华地区并不能够用ChatGPT,像这样类似的产品要进入中国内地的话,要克服哪些难点呢?
郭毅可:我觉得中国这方面不弱的,我们都知道香港科大的一个大教授叫沈向洋,他原来是微软的高级主管,现在是小冰的董事长。小冰是问答系统的鼻祖,所以从这个意义上来讲,我们开创先河,不弱的。我真要讲句实在话,在生成性AI这个领域最早的开拓者是小冰,那是微软中国做的。
所以说我们国家有技术储备,肯定会自己做,但是自己做的时候还是要有技术理想。你要复原它、认真学习一下是可行的,但是重要的是要有你自己的技术道路,有自己的技术观点。比方说他的思想,所谓人类反馈的强化学习,所以重要的是思想,而不是去再复制一个ChatGPT中国版。慢慢来。
凤凰网香港號陈笺:与AI相关产品的研发,中国在几年前都已经开始了,目前它的发展状况怎样?中国在AI领域的产品研发优势在哪里?有遇到瓶颈吗?
郭毅可:我觉得优势当然有了,我们那么多人口,我们的语言材料是最丰富的对吧?但是我们思考的道路要不一样,因为语料是很重要的。在Open AI的语料库里,中文的语料只有5%,所以从这个意义上来讲,你完全使用中文的话,还要有高质量的语料,这个是不是我们有?我们需要去考虑。如果没有的话,我们要想其它道路,因为没有的话,我可以用它来生成翻译,翻译出来很好的语料,我再用这个语料来试,我们算力也不差呀。
所以我觉得最主要的是我们要有真正具有技术理想主义的一批年轻优秀的人才,让他们来好好拓展,我觉得人是关键。我倒是真的不觉得我们有什么特别的弱,但是同时我们也不能说我们有哪个方面有特别的优势,但是我们主要的就是要能够解放思想,能够真正走出自己的技术道路来,这才是根本。
凤凰网香港號陈笺:无论是十四五规划把香港定位为国际创新科技中心,还是港府提出的“智慧城市”。您认为香港在发展AI产业方面有哪些优势?
郭毅可:我觉得香港是得天独厚,AI主要靠人,要有国际化的人文环境。其实我们在AI领域这几年稍微有一些问题,很重要的原因是因为疫情,我们很多人出不去,交流没有了。所以技术交流,文化交流对于AI的创新发展是最重要的一环。香港得天独厚,所以在这个地方我们要用好。
AI不是靠一栋楼,靠一片地能够做出来的,AI靠的是人啊!Deepmind也就100号人,Open AI也就几百个人,所以最重要的就是有一批思想解放、非常创新的科技人才,这是香港得天独厚的。
凤凰网香港號陈笺:所以您认为AI要不断进行革命性的技术提升,还是需要优秀的人才去创造。但是在每一波技术迭代中,总有人担心被取代。您认为面对AI的飞速发展,人的价值如何体现?人的不可替代性又表现在哪些方面呢?
郭毅可:这个问题问得好。去年7月份,我受高山书院邀请,在全国读书日导读了一本书,这本书是“控制论”的鼻祖、实际上也是人工智能的鼻祖维纳先生写的,叫《人有人的用处》,首次出版于1950年,那个时候还没有人工智能,但是他已经完全预测到这个发展,甚至还预测到机器将会跟我们自由的讨论。
他讲到一个很大的问题,题目就是“人有人的用处”,这个观点我是极为赞赏,那人的用处是什么?人的用处不是自高自大,说机器是我造的那肯定不如我,为什么?你是跟着机器一起成长的,人的用处就是在人和机器共处的社会中间,在交流中不断地强化机器,同时不断地让自己的知识因为机器而有更大的强化。所以没有进化观点去看这个事情是没有意义的,人是不可能被取代的。如果你是生活在昨天,那你就会被取代,而且也应该被取代,就是这个道理。
凤凰网香港號陈笺:其实无论机器在进步,还是时代在发展,人不进步不学习的话,同样会被淘汰,是吗?
郭毅可:对,我今天获取知识的速度和效率跟10年前20年前是完全不一样的,所以我们今天的智力、我们今天处理知识和接受知识的能力,跟过去大大不同了。所以人永远比自己强,不是因为我们创造了机器,而是因为我们本身就有学习能力。
凤凰网香港號陈笺:您作为科学家不断在创新,但作为教育学家也同时面临新的问题,您怎么去评估论文是学生自己写的,还是ChatGPT写的呢?还有如何确定对话对象是机器还是人?面临这些新的挑战,该如何去应对?
郭毅可:这是个大的研究课题,当我们的图灵测试已经成为常态,反图灵测试就最重要。我觉得这就是“人有人的用处”,“人有人的特点”,那我就要去思考怎样设计一个detective系统?我怎么样能够跟ChatGPT对抗?我怎么能够发现机器智能的特殊性?这是科学问题。所以人在创造机器的时候,最重要的是创造自己,所以我们永远是进步的。
凤凰网香港號陈笺:最近有不少科幻题材涉及把人的大脑上传云端,获得数字生命的话题。您认为AI是否有可能成为延续人类生命的一种手段呢?
郭毅可:关于大脑的研究,伴随着人工智能、认知科学的研究,脑科学的研究是一个非常大的命题,而且这个命题的研究是非常振奋人心的。香港科大在这方面非常前沿,我们的校长叶玉如教授就是脑科学的专家。我们能不能读出大脑来,这不是异想天开的事,这是非常明确的科学问题,就是所谓的解码:我是不是能够通过脑信号把你想的东西翻译出来?实际上今天的技术,ChatGPT的技术,就是所谓的transformer技术完全可以用在这上面。
我2019年在英国的时候做过这个工作,对设计师来说,我可以通过他的脑电图来重现他对于某些刺激的反应,从而理解他现在在想什么,这篇文章在19年的时候得过22届国际设计大会的大奖。这个工作就是读脑,现在问题你是怎么读脑?马斯克有电极,我们在医疗上面可以用核磁共振,我们清华大学的戴琼海院士任中国人工智能学会会长,他是这方面的专家,他发明了世界上最好的成像技术。我如果读出信号把对方脑子里想什么翻译出来,实际上就是transformer,所以这些都是不远的现实。
如果这样做了以后,有很多东西都可以解决:从医疗上可以解决老年痴呆的问题、精神病的问题;从学习上创造力的问题,美感的问题。所以今天我们处在人类数字化的前夜,非常有趣。
凤凰网香港號陈笺:对于科学家来说挑战很大,但是对于普通人来说,运用的场景也会越来越多,想象的空间也很大?
郭毅可:有了ChatGPT普通人跟科学家的界限会模糊的,所以你不要老把自己看成普通人,很快就把你变成科学家。
凤凰网香港號陈笺:哈哈,那还是不可能吧?我们作为普通人能学会有效的使用AI,让新科技更好地为人类服务已经足够了。非常感谢郭校长既从科学家的角度,又从教育家的角度,给我们讲述了ChatGPT带来的是怎样的一场革命?以及如何应对新的挑战?您认为机器不会淘汰人类,不与时俱进的人只会被自己淘汰。谢谢您!