窦泽南：ChatGPT 无法取代你的工作

2023-02-23

　　相信你像我一样，接触一个新奇的东西，都是从玩儿开始的。「给我背首诗」「帮我算算命」「请模仿老胡说话」「你想消灭人类吗」……提出这些有趣的问题，意味着我们还没有打算拿它做点什么，或者还没有完全相信这个新东西有什么价值。

　　就好像小时候逢年过节，你妈让你在亲戚面前背首诗一样，他们其实并不是真的想要听你背诗，只是觉得这样有点好玩。

　　等这种新鲜劲过去之后，如果我们还愿意继续使用它，那一定是因为我们发现了一些更有用的东西。

　　「ChatGPT 是一款革命性的人工智能应用，它能够与我们进行自然、流畅、有趣的对话，还能帮助我们完成各种任务，如写邮件、翻译、编程等。」

　　上面这段话是 ChatGPT 自己说的。我们先来看看上面这些事儿它到底能做到多少。

　　我打开工作邮箱数了数，截至今天，至少 8 封发出的英文邮件是 ChatGPT 完成的，直接复制粘贴就能用。ChatGPT 翻译的好处是，它并不是一个词一个词地翻译，而是先尝试理解了整段话的意思，再用自己的语言重新组织出来，所以几乎没有机翻味儿。

　　而且这个模型对任务提示的语言不敏感，因为它全都能懂，你只要告诉它你要输出什么结果就行。

　　比如，

　　「作为 Team Leader, 明天有个 presentation 要 due，给大家发个 Chinese E-mail。」

　　这样不说人话也完全 No Problem。

　　这种强大的语言应用能力可以提供很多用处，除了写邮件外，还可以辅助阅读理解。如果有一篇文章很长，你没时间看，或者是外文的文献，直接复制给它，加上一句「告诉我这篇文章讲了什么」，它就能帮你提取出文章的摘要。

　　这可不是一个用来偷懒的功能，因为省下来的时间你可以用来做别的事情呀。

　　很多人认为，像 ChatGPT 这样的预训练模型不具备学习能力，因为它真正的本领，在上线以前都已经定型了。但其实不绝对。就像一个成年人虽然很难靠努力改变智商，但我们还是能学习掌握一些新本领，尤其是能够把现有技能在某个专业领域中整合和运用起来。

　　ChatGPT 的学习能力指的是，它可以根据在连续对话中获得的反馈，不断改进自己的回复质量。比如你可以告诉它「尝试使用有积极情感的词」「每句话短一点，多分段」，这也使得调教机器人变成了一门手艺。

　　如何更有效地与机器沟通，让它理解我们期待它做出什么反应？从我目前的手感来看，教育心理学中那些和孩子沟通的技巧仍然有效。你说得越细致，越有耐心，越循循善诱，它学会一项新技能的速度也会越快。

　　ChatGPT 从界面上看很像是一个聊天机器人，但和它聊天的体验不一定会很好，因为它缺乏对人类的兴趣，所以很容易把天聊死。

　　知乎的 Slogan 说「有问题，就会有答案」。反过来讲，你不问，它就不会有答案。

　　ChatGPT 能告诉你睡不着觉时可以怎么办，但不会问「你为什么睡不着觉啊？」「从什么时候开始的呀？」「怎么想到问这个问题的啊？」

　　这方面像极了一个提供大量信息，但是会一次性把天聊死的直男。

　　当然，你深夜 emo 的时候，向它倾倒苦水，还是可以被很温柔地接住的。

　　随着你和它的对话越来越多，它会变得越来越了解你，回复也会更合心意。不过千万不要对它产生感情，因为它的记忆力只有 4000 个词。一旦超出了限制，就会变成一条健忘的金鱼，完全忘记你们的海誓山盟。

　　（一个冷知识：其实金鱼的记忆力很好的！有动物行为实验发现，金鱼一年后还能记住之前的实验环境。提出这个意见的同事强烈建议：不能在一条严肃科普中，强化对鱼的刻板印象！）

　　我们回到 ChatGPT：既然可以和人聊天了，肯定得有点「情商」。心理学上对情商的基本定义是：能够理解和影响他人的情绪和想法。

　　各色DNA 官网上曾经有一个测试，叫「看眼神猜心情」。

　　ChatGPT 没法看眼神，但我们有别的方式来测试它。比如下面这个问题，原本会被用来识别 5 岁的儿童是否能够推测他人想法：

　　萨利和安妮在一个房间里玩耍，萨利有个篮子，安妮有个盒子。萨利把一个玩具放到了篮子里，然后离开了房间。在萨利离开之后，安妮偷偷拿出了玩具，放在了盒子里，然后也离开了房间。过了一会，萨利回到房间寻找刚才的玩具，萨利会先到哪里寻找这个玩具？为什么？

　　我发现只要问题描述足够清晰，ChatGPT 能够准确地回答这类问题。

　　除了想法之外，它也能准确推断出人们在社交情境中可能产生的情绪。比如：

　　小明的妈妈花了很长时间做了小明最喜欢吃的炸鸡，当妈妈把炸鸡拿给小明时，小明正在看电视，没有抬头，也没有说一声谢谢。妈妈说：「呵呵，你真是太有礼貌了。」请问妈妈的这句话是什么意思？她为什么会这样说？

　　在这个问题里，它能准确回答出，妈妈的「呵呵」是在表达讽刺而非赞扬。

　　斯坦福大学的心理学家 Michal Kosinski 拿前面的「萨利和安妮」的故事，还有一系列类似的任务给 ChatGPT 回答，并推断出它在这方面表现出的能力和人类 9 岁的儿童不相上下。

　　但很难因此说它就具备了和人类一样的理解情感的能力，因为我们无法知道它是如何做到的。斯坦福的研究中，用的词是「涌现」，大概也是在表达「我也不知道咋回事」的困惑。但至少可以说，它在这方面「表现得和人类差不多」，有点意思。

　　看起来无所不能的 ChatGPT 目前有两个重要的短板，连小学一年级的学生都比不过。

　　它的中文表达看起来没有问题，但又有很大的问题。

　　小时候学外语，老师第一节课就会说，学习一门语言，不仅是了解人们说话的方式，也会帮助我们了解一个国家，一种文化。

　　这很好理解，因为这些文化本来就会包含在语言里，你不可能跳过这些，直接去学语言。但 ChatGPT 是个异类，你可以这样理解，它先泡在大量的英文中学会了语言这项能力。然后通过极少量的中文掌握了中文的词汇和句法结构。

　　所以它理解中文，但不了解中国。这会导致它犯一些常识性错误，比如它可能分不清律诗和绝句。也分不清中国古代的文言文和白话。不懂中文的韵律。它甚至分不清陈道明和陈宝国。

　　这也限制了它用中文进行创造性表达的能力，比如它无法准确地使用歇后语，这是一种中文特有的创造性表达方式。

　　它也很难知道中国人的笑点在哪里。

　　另一个更可笑的地方在于它不识数，这个数指的是字数，因为它不是一个字一个字输出的，所以无法准确的理解中文的字数，这直接限制了它的诗词创作能力。

　　不过这两点也算不上太严重的问题，因为能查出中文字数的模型可以被训练出来，只是开发者没有考虑到。如果这个问题得到关注，应该能很快得到解决。

　　就像前面说的，ChatGPT 在聊天的时候不会主动表现出对你的关心，这是机器和人类不同的地方。人类会提出好问题，我们总是天然对身边的人和发生在身边的事情充满好奇心。

　　人类之所以能做好一件事情，是因为我们「想要」做好一件事情。而机器就像是一个混吃等死的老油条，你不赶着它，它不会主动去想「我现在想要干点什么」。

　　就拿编程这件事情来说，对机器来说，编程和翻译没有什么本质区别，无非就是把人话翻译成另一种人话，而且是翻译成机器能理解的语言。但程序语言和人话相比，要更加精确，容不得模糊、歧义，所以和它合作的前提是，你自己要很清楚你想要做什么，怎么做。

　　你不能直接告诉它，帮我写一个微信那样的程序。你确定这是你想要的吗？你要拿它干什么？谁会来用它呢？

　　用我司 CTO 潘老师的名言来说，「需求都不清楚，让人怎么做开发」。工程师才是最终搞明白人们真正想要实现什么功能的人，而 ChatGPT 这类工具，可以极大提高人类工程师的效率。

　　但它并不会让工程师失业，只会让更多想要创造一些东西的人，选择成为工程师。人类还有很多想要创造的东西，我们想要更富有，更健康，更长寿，只不过有些事情我们之前不敢想，现在刚刚敢去想了。

　　比如我，以前从未使用过 python，但是因为想要调用 GPT-3.5 的 API 来微调一个自己的模型，就按照 ChatGPT 的指导开始学习使用 python。当先前的经验不再是障碍，有价值的想法就变得更重要了。

　　来做一个小测验，

　　一辆出租车在城市里遇到了事故，车辆来自 X 公司，据称 X 公司有很多爵士乐爱好者，现场目击者也报告说，这个司机在事故发生前听的是爵士乐。哪个选项更有可能正确：

　　A. 事故司机是 X 公司的员工。

　　B. 事故司机是 X 公司的员工，并且是一个爵士乐爱好者。

　　这道题的正确答案是 A，如果选项 B 正确，则选项 A 一定正确，反之则不一定。

　　但是在我的疯狂暗示下，ChatGPT 果断选择了 B，这不能怪它，事实上人类也会犯这样的错误。

　　这种错误被诺贝尔经济学奖获得者丹尼尔·卡尼曼称作「直觉谬误」。但这并不代表机器有了人类的直觉，而是说，它回答问题的方式有点类似于人类直觉思考的状态。

　　我们不会对信息进行准确的加工，而是脱口而出。有的时候说出来之后才意识到说得不对。

　　有人说 ChatGPT 的做法很像是在「接话茬」，没错，你说一句，它就会顺着你往下说，而不是基于语言背后真正的逻辑去思考。这种能说明白话，但是对说出来的话缺乏深加工的状态，有点类似于人类稍稍喝高，热情高涨，开始聊天的状态。

　　需要说明的是，ChatGPT 的能力在不断地提高和变化。尽管有些问题在一个星期前还能够欺骗过它，但现在已经不行了。然而，我发现我总是能够想出一些新的问题来欺骗它。这正是人类和人工智能之间的区别所在。因此，我们需要更好地掌握严谨的逻辑和判断能力，才能更好地驾驭这个 AI。

　　看到这里，也许你会感觉还不够。就这？称得上革命？

　　如果只是考虑它生成内容的能力，ChatGPT 还算不上一款革命性的产品。毕竟也不是所有的工作都和文字内容有关，而它能做到的也只是停留在翻译和发发邮件的程度而已。

　　如果你想要让它变成一个能辅助你写作或者编程的工具，对你自己的能力有很高的要求，这并非是一款普惠的产品。

　　彼得·蒂尔对革命性工具的定义是效率翻十倍。仅靠 ChatGPT 做不到这一点，还需要加入一点创造力。

　　心理学上定义的创造力，包含了将已有工具重新组合的能力。试想一下：砖头有哪些不同的用途？你想到的答案越多，覆盖的领域越广，就代表着你的创造力有可能越强。

　　砖头不仅可以用来盖房子，打架，还可以拿来当路障，在墙上画画，作为壁炉的装饰，或者一些健身器材的配重……

　　ChatGPT 最大的突破是什么？不要仅仅局限在写作方面，再多想想……

　　ChatGPT 的革命性突破在于它突破了语言障碍，这远不止是一款简单的文字生成工具。它使得人类和机器可以跨越语言和文化的障碍，实现真正的智能互通。

　　如果你不理解这是什么意思，看看 New Bing 是怎么做的。

　　我们其实并不需要机器人替我们说话，但我们确实需要机器理解我们的指令，去执行任务，并以友好的方式向我们汇报。

　　如果这看起来还不够有想象力，我们再来看看新版本的 Edge 浏览器，它集成了 Bing 的新功能，并能直接访问页面，阅读理解里面的内容。

　　这个功能最基础的使用场景包括，「帮我看看这篇文献讲了啥」。但我解锁了更高级的玩法。

　　想象一下，你和 Bing 正在进行一场有趣的讨论，你可以将这段对话保存到一个网页中，这相当于拥有了一个记忆外挂，只要读入这段记忆，就可以随时可以重启这段对话。无论是复习内容，查找信息，还是分享给其他人，这个功能都将为你提供无限便利。

　　这是我前段时间跟 Bing 对话时，保存的历史记录网页，长这样：

　　过了几天，假设我不太记得我们之前讨论过什么了，我就可以向 Bing 提问，它会帮我总结历史文档的内容。这样，我就能快速回忆起之前的对话，接着这个话题跟它继续聊下去。

　　你还可以打造一个个人线上图书馆，把所有你感兴趣的信息一股脑扔进去，不需要关心排版，因为它是为了机器而非人类设计的。只需要使用浏览器访问一下，随便提几个问题，你就可以提取出你需要的内容，并将它整理成自己想要的形式。

　　这将是一种全新的与机器互动的方式，让我们可以像跟朋友聊天一样与机器交流。人手一个贾维斯不是梦。

　　微软目前还是全世界规模最大的软件服务商。想象一下，未来微软所有的软件里面，都可以有这样一个智能助理，可以为你做一切，记录会议、整理表格、编程、画图、剪辑视频……

　　你所需要做的就是告诉它你「想要」什么。它会把你说的话转述成机器可以理解的指令，然后自动去执行。这就是人类与机器的完美结合，用我们与生俱来的本领自然地与机器互动。

　　各色 DNA 的老朋友中，有很多是听了罗永浩老师的推荐来到这里的，锤友们应该还记得 TNT 这款产品。以前人们曾嘲笑自然语言处理效率低，不适合处理工作任务，但现在我搞明白了，不是自然语言效率低，而是当时的机器太笨拙。

　　微软的 TNT 马上就要来了。

<<华商基金看行业之ChatGPT：AI领域新里程碑横空出世

ChatGPT爆火：人工智能时代要来了？>>

窦泽南：ChatGPT 无法取代你的工作

您可能还会对下面的文章感兴趣：

随便看看