窦泽南:ChatGPT 无法取代你的工作
相信你像我一样,接触一个新奇的东西,都是从玩儿开始的。「给我背首诗」「帮我算算命」「请模仿老胡说话」「你想消灭人类吗」……提出这些有趣的问题,意味着我们还没有打算拿它做点什么,或者还没有完全相信这个新东西有什么价值。
就好像小时候逢年过节,你妈让你在亲戚面前背首诗一样,他们其实并不是真的想要听你背诗,只是觉得这样有点好玩。
等这种新鲜劲过去之后,如果我们还愿意继续使用它,那一定是因为我们发现了一些更有用的东西。
「ChatGPT 是一款革命性的人工智能应用,它能够与我们进行自然、流畅、有趣的对话,还能帮助我们完成各种任务,如写邮件、翻译、编程等。」
上面这段话是 ChatGPT 自己说的。我们先来看看上面这些事儿它到底能做到多少。
我打开工作邮箱数了数,截至今天,至少 8 封发出的英文邮件是 ChatGPT 完成的,直接复制粘贴就能用。ChatGPT 翻译的好处是,它并不是一个词一个词地翻译,而是先尝试理解了整段话的意思,再用自己的语言重新组织出来,所以几乎没有机翻味儿。
而且这个模型对任务提示的语言不敏感,因为它全都能懂,你只要告诉它你要输出什么结果就行。
比如,
「作为 Team Leader, 明天有个 presentation 要 due,给大家发个 Chinese E-mail。」
这样不说人话也完全 No Problem。
这种强大的语言应用能力可以提供很多用处,除了写邮件外,还可以辅助阅读理解。如果有一篇文章很长,你没时间看,或者是外文的文献,直接复制给它,加上一句「告诉我这篇文章讲了什么」,它就能帮你提取出文章的摘要。
这可不是一个用来偷懒的功能,因为省下来的时间你可以用来做别的事情呀。
很多人认为,像 ChatGPT 这样的预训练模型不具备学习能力,因为它真正的本领,在上线以前都已经定型了。但其实不绝对。就像一个成年人虽然很难靠努力改变智商,但我们还是能学习掌握一些新本领,尤其是能够把现有技能在某个专业领域中整合和运用起来。
ChatGPT 的学习能力指的是,它可以根据在连续对话中获得的反馈,不断改进自己的回复质量。比如你可以告诉它「尝试使用有积极情感的词」「每句话短一点,多分段」,这也使得调教机器人变成了一门手艺。
如何更有效地与机器沟通,让它理解我们期待它做出什么反应?从我目前的手感来看,教育心理学中那些和孩子沟通的技巧仍然有效。你说得越细致,越有耐心,越循循善诱,它学会一项新技能的速度也会越快。
ChatGPT 从界面上看很像是一个聊天机器人,但和它聊天的体验不一定会很好,因为它缺乏对人类的兴趣,所以很容易把天聊死。
知乎的 Slogan 说「有问题,就会有答案」。反过来讲,你不问,它就不会有答案。
ChatGPT 能告诉你睡不着觉时可以怎么办,但不会问「你为什么睡不着觉啊?」「从什么时候开始的呀?」「怎么想到问这个问题的啊?」
这方面像极了一个提供大量信息,但是会一次性把天聊死的直男。
当然,你深夜 emo 的时候,向它倾倒苦水,还是可以被很温柔地接住的。
随着你和它的对话越来越多,它会变得越来越了解你,回复也会更合心意。不过千万不要对它产生感情,因为它的记忆力只有 4000 个词。一旦超出了限制,就会变成一条健忘的金鱼,完全忘记你们的海誓山盟。
(一个冷知识:其实金鱼的记忆力很好的!有动物行为实验发现,金鱼一年后还能记住之前的实验环境。提出这个意见的同事强烈建议:不能在一条严肃科普中,强化对鱼的刻板印象!)
我们回到 ChatGPT:既然可以和人聊天了,肯定得有点「情商」。心理学上对情商的基本定义是:能够理解和影响他人的情绪和想法。
各色DNA 官网上曾经有一个测试,叫「看眼神猜心情」。
ChatGPT 没法看眼神,但我们有别的方式来测试它。比如下面这个问题,原本会被用来识别 5 岁的儿童是否能够推测他人想法:
萨利和安妮在一个房间里玩耍,萨利有个篮子,安妮有个盒子。萨利把一个玩具放到了篮子里,然后离开了房间。在萨利离开之后,安妮偷偷拿出了玩具,放在了盒子里,然后也离开了房间。过了一会,萨利回到房间寻找刚才的玩具,萨利会先到哪里寻找这个玩具?为什么?
我发现只要问题描述足够清晰,ChatGPT 能够准确地回答这类问题。
除了想法之外,它也能准确推断出人们在社交情境中可能产生的情绪。比如:
小明的妈妈花了很长时间做了小明最喜欢吃的炸鸡,当妈妈把炸鸡拿给小明时,小明正在看电视,没有抬头,也没有说一声谢谢。妈妈说:「呵呵,你真是太有礼貌了。」请问妈妈的这句话是什么意思?她为什么会这样说?
在这个问题里,它能准确回答出,妈妈的「呵呵」是在表达讽刺而非赞扬。
斯坦福大学的心理学家 Michal Kosinski 拿前面的「萨利和安妮」的故事,还有一系列类似的任务给 ChatGPT 回答,并推断出它在这方面表现出的能力和人类 9 岁的儿童不相上下。
但很难因此说它就具备了和人类一样的理解情感的能力,因为我们无法知道它是如何做到的。斯坦福的研究中,用的词是「涌现」,大概也是在表达「我也不知道咋回事」的困惑。但至少可以说,它在这方面「表现得和人类差不多」,有点意思。
看起来无所不能的 ChatGPT 目前有两个重要的短板,连小学一年级的学生都比不过。
它的中文表达看起来没有问题,但又有很大的问题。
小时候学外语,老师第一节课就会说,学习一门语言,不仅是了解人们说话的方式,也会帮助我们了解一个国家,一种文化。
这很好理解,因为这些文化本来就会包含在语言里,你不可能跳过这些,直接去学语言。但 ChatGPT 是个异类,你可以这样理解,它先泡在大量的英文中学会了语言这项能力。然后通过极少量的中文掌握了中文的词汇和句法结构。
所以它理解中文,但不了解中国。这会导致它犯一些常识性错误,比如它可能分不清律诗和绝句。也分不清中国古代的文言文和白话。不懂中文的韵律。它甚至分不清陈道明和陈宝国。
这也限制了它用中文进行创造性表达的能力,比如它无法准确地使用歇后语,这是一种中文特有的创造性表达方式。
它也很难知道中国人的笑点在哪里。
另一个更可笑的地方在于它不识数,这个数指的是字数,因为它不是一个字一个字输出的,所以无法准确的理解中文的字数,这直接限制了它的诗词创作能力。
不过这两点也算不上太严重的问题,因为能查出中文字数的模型可以被训练出来,只是开发者没有考虑到。如果这个问题得到关注,应该能很快得到解决。
就像前面说的,ChatGPT 在聊天的时候不会主动表现出对你的关心,这是机器和人类不同的地方。人类会提出好问题,我们总是天然对身边的人和发生在身边的事情充满好奇心。
人类之所以能做好一件事情,是因为我们「想要」做好一件事情。而机器就像是一个混吃等死的老油条,你不赶着它,它不会主动去想「我现在想要干点什么」。
就拿编程这件事情来说,对机器来说,编程和翻译没有什么本质区别,无非就是把人话翻译成另一种人话,而且是翻译成机器能理解的语言。但程序语言和人话相比,要更加精确,容不得模糊、歧义,所以和它合作的前提是,你自己要很清楚你想要做什么,怎么做。
你不能直接告诉它,帮我写一个微信那样的程序。你确定这是你想要的吗?你要拿它干什么?谁会来用它呢?
用我司 CTO 潘老师的名言来说,「需求都不清楚,让人怎么做开发」。工程师才是最终搞明白人们真正想要实现什么功能的人,而 ChatGPT 这类工具,可以极大提高人类工程师的效率。
但它并不会让工程师失业,只会让更多想要创造一些东西的人,选择成为工程师。人类还有很多想要创造的东西,我们想要更富有,更健康,更长寿,只不过有些事情我们之前不敢想,现在刚刚敢去想了。
比如我,以前从未使用过 python,但是因为想要调用 GPT-3.5 的 API 来微调一个自己的模型,就按照 ChatGPT 的指导开始学习使用 python。当先前的经验不再是障碍,有价值的想法就变得更重要了。
来做一个小测验,
一辆出租车在城市里遇到了事故,车辆来自 X 公司,据称 X 公司有很多爵士乐爱好者,现场目击者也报告说,这个司机在事故发生前听的是爵士乐。哪个选项更有可能正确:
A. 事故司机是 X 公司的员工。
B. 事故司机是 X 公司的员工,并且是一个爵士乐爱好者。
这道题的正确答案是 A,如果选项 B 正确,则选项 A 一定正确,反之则不一定。
但是在我的疯狂暗示下,ChatGPT 果断选择了 B,这不能怪它,事实上人类也会犯这样的错误。
这种错误被诺贝尔经济学奖获得者丹尼尔·卡尼曼称作「直觉谬误」。但这并不代表机器有了人类的直觉,而是说,它回答问题的方式有点类似于人类直觉思考的状态。
我们不会对信息进行准确的加工,而是脱口而出。有的时候说出来之后才意识到说得不对。
有人说 ChatGPT 的做法很像是在「接话茬」,没错,你说一句,它就会顺着你往下说,而不是基于语言背后真正的逻辑去思考。这种能说明白话,但是对说出来的话缺乏深加工的状态,有点类似于人类稍稍喝高,热情高涨,开始聊天的状态。
需要说明的是,ChatGPT 的能力在不断地提高和变化。尽管有些问题在一个星期前还能够欺骗过它,但现在已经不行了。然而,我发现我总是能够想出一些新的问题来欺骗它。这正是人类和人工智能之间的区别所在。因此,我们需要更好地掌握严谨的逻辑和判断能力,才能更好地驾驭这个 AI。
看到这里,也许你会感觉还不够。就这?称得上革命?
如果只是考虑它生成内容的能力,ChatGPT 还算不上一款革命性的产品。毕竟也不是所有的工作都和文字内容有关,而它能做到的也只是停留在翻译和发发邮件的程度而已。
如果你想要让它变成一个能辅助你写作或者编程的工具,对你自己的能力有很高的要求,这并非是一款普惠的产品。
彼得·蒂尔对革命性工具的定义是效率翻十倍。仅靠 ChatGPT 做不到这一点,还需要加入一点创造力。
心理学上定义的创造力,包含了将已有工具重新组合的能力。试想一下:砖头有哪些不同的用途?你想到的答案越多,覆盖的领域越广,就代表着你的创造力有可能越强。
砖头不仅可以用来盖房子,打架,还可以拿来当路障,在墙上画画,作为壁炉的装饰,或者一些健身器材的配重……
ChatGPT 最大的突破是什么?不要仅仅局限在写作方面,再多想想……
ChatGPT 的革命性突破在于它突破了语言障碍,这远不止是一款简单的文字生成工具。它使得人类和机器可以跨越语言和文化的障碍,实现真正的智能互通。
如果你不理解这是什么意思,看看 New Bing 是怎么做的。
我们其实并不需要机器人替我们说话,但我们确实需要机器理解我们的指令,去执行任务,并以友好的方式向我们汇报。
如果这看起来还不够有想象力,我们再来看看新版本的 Edge 浏览器,它集成了 Bing 的新功能,并能直接访问页面,阅读理解里面的内容。
这个功能最基础的使用场景包括,「帮我看看这篇文献讲了啥」。但我解锁了更高级的玩法。
想象一下,你和 Bing 正在进行一场有趣的讨论,你可以将这段对话保存到一个网页中,这相当于拥有了一个记忆外挂,只要读入这段记忆,就可以随时可以重启这段对话。无论是复习内容,查找信息,还是分享给其他人,这个功能都将为你提供无限便利。
这是我前段时间跟 Bing 对话时,保存的历史记录网页,长这样:
过了几天,假设我不太记得我们之前讨论过什么了,我就可以向 Bing 提问,它会帮我总结历史文档的内容。这样,我就能快速回忆起之前的对话,接着这个话题跟它继续聊下去。
你还可以打造一个个人线上图书馆,把所有你感兴趣的信息一股脑扔进去,不需要关心排版,因为它是为了机器而非人类设计的。只需要使用浏览器访问一下,随便提几个问题,你就可以提取出你需要的内容,并将它整理成自己想要的形式。
这将是一种全新的与机器互动的方式,让我们可以像跟朋友聊天一样与机器交流。人手一个贾维斯不是梦。
微软目前还是全世界规模最大的软件服务商。想象一下,未来微软所有的软件里面,都可以有这样一个智能助理,可以为你做一切,记录会议、整理表格、编程、画图、剪辑视频……
你所需要做的就是告诉它你「想要」什么。它会把你说的话转述成机器可以理解的指令,然后自动去执行。这就是人类与机器的完美结合,用我们与生俱来的本领自然地与机器互动。
各色 DNA 的老朋友中,有很多是听了罗永浩老师的推荐来到这里的,锤友们应该还记得 TNT 这款产品。以前人们曾嘲笑自然语言处理效率低,不适合处理工作任务,但现在我搞明白了,不是自然语言效率低,而是当时的机器太笨拙。
微软的 TNT 马上就要来了。