别怕，ChatGPT抢不走你的饭碗，人类大脑才是最高级的算法

2023-03-04

　　“想象力是人类所拥有的一种似乎只应属于神的能力，它存在的意义也远超出我们的想象。”《三体》

　　整个2月，一款Open AI公司开发的机器人聊天工具ChatGPT，凭借会聊天和会来事成功出圈。很多人尤其是内容创作者，因此担忧自己的工作是否会被AI所取代。热爱码字的我，也学习和研究了一下。以下为学习体会，跟各位汇报。

　　如果只能用一句话总结我会说：

　　这句话的另一层意思是：

　　下面我从核心原理、模型训练、以及底层技术路径这三个角度来分别说明，看完这三点也就基本知道ChatGPT是啥了：

　　核心原理：基于人类反馈的强化学习

　　ChatGPT作为一款聊天机器人模型，本质上是交互式人工智能应用的一种。之所以吸引关注的点在于它能实现和人一样的交流，还能完成工作文件、文案创作等。其核心原理是在原有的Transformer模型（图形神经网络的一种）基础上，引入了新技术RLHF(Reinforcement Learning with human feedback), 即基于人类反馈的强化学习。这能帮助机器人生成的内容，和人类的常识、需求和价值观一致。最终使得ChatGPT具备了强大的语言理解能力和丰富的语言表达能力。也是它能聊天和会来事的根本原因所在。

　　实现步骤：三模型训练法

　　这个机器强化学习的模型训练是通过三个步骤来完成的。我将其概括为：先做填空题，再做有奖竞答题，最后再一边填空一边有奖竞答。用官网的专用术语总结如下：

　　步骤一：有监督的微调模式（SFT模型）

　　步骤二：训练奖励模型（RM模型）

　　步骤三：迭代RM模型为参数，PPO算法优化SFT模型

　　别怕，ChatGPT抢不走你的饭碗，人类大脑才是最高级的算法(图1) 数据来源：OpenAI官网

　　这三个步骤的强化训练，用大白话说就是：先提问、再抢答，最后又提问又抢答，如此反复升华。然后机器人就越来越像普通人类了。不准确但大体是这个意思。当然复杂的事情简单的说是为了便于理解，但实际远比这复杂的多。比如大模型在技术实现上对算力和算法要求就很高。

　　技术路径：ChatGPT属于GPT3.5代产品

　　OpenAI公司的产品迭代路径和发布年份如下

　　GPT1.0→GPT2.0→GPT3.0→GPT3.5

　　2018年→2019年→2020年→2022年

　　InstructGPT&ChatGPT为GPT3.5代

　　人工智能底层技术的发展路径：

　　机器学习 → 神经网络 → Transformer算法

　　2012年~ →2015年~→2017年~

　　产业链的传导路径：

　　基础算力 → 算法 → 应用端→ 终端应用

　　AI芯片/GPU/CPU→数据/模型→内容→文字/图片/视频等

　　受限于模型本身，ChatGPT当前仍有不少需要优化的课题。比如

　　1.有限提问：对措辞敏感，换个问法答案不同

　　2.无效回答：答非所问似是而非，甚至不懂装懂

　　3.投机揣测：喜欢猜测用户意图，多于认真回答

　　另外，任何一种人工智能的运用还同时面临着安全性和伦理约束这两个绕不开的课题。说到底，技术只是技术，如何使用它取决于人类自身。

　　需要注意的是，对于这样一个国外先行者OpenAI公司尚且在商业应用上处于探索初期的东西，国内市场相关概念股先涨为尽。1月20日至2月16日短短1个月不到的时间，万得ChatGPT指数已经上涨了49.48%。其中的很多公司商业应用都还没开始，真的只是概念。

　　打个比方吧。如果说，智能手机的始祖是苹果，而苹果划时代的产品是2008年发布的苹果3代（iPhone3G）：一台拥有互联网技术的全触控手机。这在当时算是手机界的巅峰了，从此开启了智能手机时代。现在的ChatGPT就类似于2008年的iPhone3G。如今，2015年成立、2019年获得了微软投资的OpenAI公司，或许也会开启一个全新的人工智能时代。

　　按照上述基础算力→算法→应用端→终端应用的产业链传导路径来看，我们目前并不缺大数据，数据要素化也在深入推进。关键还是算力和算法。主要的算力提供商包括阿里、腾讯、百度、商汤等。而在算法层，涉及到AI大模型的核心技术，进入壁垒较高，也只有百度、腾讯、字节等少数公司具备基础去完成大模型的设计迭代。至于应用端，则至少要等到庞大的算力、算法分析模型建立起基础优势以后的事情了。百度已经官宣即将在3月完成类ChatGPT的产品：文心一言（ERNIE Bot）的内测，并向公众开放，期待。

　　从另一个角度看，ChatGPT需要优化的地方，也正是它的成功之处。因为对于机器人来说“像人一样”已经是最高的赞赏。而ChatGPT的成功恰恰在于，它比以往的人工智能更像普通人类。

　　而作为智人后代的我们，更值得思考的应是，如何更好的发挥想象力创造力而让自己变得不普通。

　　因为这才是整个人类文明进步的源泉所在。

　　最近同时在看的两本书，让我产生了一些奇妙的思考。一本是《资治通鉴》，另一本是《中国哲学简史》。前者是宋代司马光写的，对，就是小时候光砸缸的那位智者，后者是冯友兰先生所作。前为史，后者为哲学史。

　　资治通鉴作为我国第一部编年体通史，起于周、至五代十国共十个朝代1362年的历史。宋神宗以其书“鉴于往事，有资于治道”，赐名为《资治通鉴》。教员酷爱通鉴，通读穷一十七遍，且言每读一遍都获益匪浅。

　　中国哲学简史，则是冯友兰先生学术生命黄金时期的精湛之作。原本是为了向外国人介绍中国文化而写就，却成为了解中国哲学流传最广、影响最大的著作之一。用宗璞先生的话说，“这本书像是太上老君炼出来的仙丹，把浩繁的史册浓缩得可以一口吞！”

　　从历史中去了解哲学史，就好比穿越千年，能够更好的理解当时的先哲们为何会有如此洞见。举个例子，司马光写通鉴，以周威烈王二十三年，三家分晋开篇。这被后人认为是春秋时代结束，战国时代开始。恰恰是在那样一个巨变的时代，使得中国出现了第一次有组织的哲学思想运动：诸子百家。各个哲学流派的竞争既推动了当时社会的进步，又构成了中国古代的灿烂文化。至今我们的身上都或多或少有些儒、道的影子。

　　按照中国哲学的传统，哲学特别是形而上学，不是为了人对客观实际增加正面的知识，而是为了提高人的心智。每个哲学流派又都有自己的模型和算法。比如，儒家游方之内，追求内圣外王；道家游方之外，主张顺应事物和人的本性。方，就是指社会。也因此，我们中国人在入世和出世之间，总体上平衡感较好。

　　最终，西方哲学从演绎入手，建立起现象→逻辑→方法论→方法论体系的哲科思维大模型；而中国哲学则从直觉入手，建立起道→法→术→器→势的道法思维大模型。每个时代的先哲们，又将这两个大模型各自迭代。现在我们迎来了百年未有之大变局时代，无论哪个大模型都可以也应该被我们兼容并蓄，强化学习。唯如此，才能仰之弥高、钻之弥坚。

　　就好比，如果真的模型吃透了，我们用五句话就可以完整说清楚唯物辩证法：

　　世界是物质的，

　　物质是运动的，

　　运动是有规律的，

　　规律是可以被认识的，

　　认识是需要一个过程的。

　　哲学，通常分为“宇宙论”（本体论）即形而上学、“人生论”（包括伦理学）、“认识论”三部分。换句话说，哲学是对人生系统的反思。所有的模型都是反思的产物，甚至“人生”“生命”“宇宙”的概念也都是反思的产物。和“ChatGPT”这个概念并没有什么不同。我将这样系统的反思表述为：

　　我们如何认识世界？

　　我们如何认识自己？

　　我们如何处理自己和世界的关系？

　　无论是否意识到，这是我们每个人一生的实践。人不满足于现实世界，而追求超越现实世界，这是人类内心深处的一种渴望。哲学是如此，今天的人工智能也是如此。

　　要想知道一个东西是什么，可以弄清它不是什么。就像我们之所以成为我们，不是因为我们所做的那些事，而是因为我们不做的那些事。价值投资亦如此。人在学会使用负的方法之前，都必须经过使用正的方法这个阶段。

　　好比有时候需要一点声音，才能意识到周围的安静。音乐需要停顿，才能感受到悦耳的动听。绘画留白了，才有别样的美。

　　说到底，人脑才是最高级的算法。

　　特别欣赏冯友兰先生写在结尾的那句话：

　　人工智能终究不能也不应代替人类，宇宙的尽头还得是人类的真心相伴。

　　$百度$腾讯

　　别怕，ChatGPT抢不走你的饭碗，人类大脑才是最高级的算法(图2)

　　价值投资信奉者，诚心码字，点赞随缘~

　　愿你在这里遇到更好的自己~

<<泰达宏利孙硕：ChatGPT催化AI投资,算力算法存机会

ChatGPT引爆AI新纪元，建模机器人“玄鸟”赋能多元应用｜AI｜机器人｜熊猫>>

别怕，ChatGPT抢不走你的饭碗，人类大脑才是最高级的算法

您可能还会对下面的文章感兴趣：

随便看看