拿来主义行不通！因为ChatGPT的这一点真不好拿！

2023-02-11

我们国家什么时候才可以研发出像ChatGPT这样牛逼的人工智能产品？有人说拿来主义，复制一份不就好了吗？话糙理不糙，因为这确实是最快的一个渠道，但是ChatGPT这种产品的4个先决条件，我们已经满足了3个，其中有一个我个人感觉确实暂时拿不动！

下面我直接列举了8个问题，应该可以回复你关于ChatGPT的大多数疑问，而与此同时，当你看完之后，你应该对ChatGPT会有一个全新的认识，你也会明白，为什么我说有一点暂时拿不动！

不废话直接上干货，先看一下GPT这个模型的一个时间里程碑:

OpenAI从2018年开始研发GPT模型，到2022年11月30日正式发布基于GPT3.5模型的ChatGPT聊天机器人，期间总共历时大概四年半，进入了2023年的2月份，ChatGPT只用了5天就吸引了100万订阅用户，而到今天大概只有两个月的时间，它更是达成了1亿活跃独立用户的历史最快成绩，由此可见，这个玩意儿确实是革命性的，比尔盖茨更是称赞它的出现不亚于电子计算机或者是互联网的出现，其影响力可见一斑。

你的可能疑问

问：ChatGPT可以访问互联网吗？

答：ChatGPT和其他基于Transformer（转换器）的大型语言模型是无法访问互联网的，但是想让人工智能领域里的模型去访问互联网，应该是一件很简单的事情，这一层是可以单独构建的，后续很有可能会出现一个WebGPT的概念。

简单说一下什么是transform模型，它是一种神经网络，可以通过跟踪序列数据中的关系，比如说某句话中的单词来学习上下文，它会应用一组不断发展的数学技术，我们可以称之为注意力，或者是自主注意力，去感应遥远数据元素中的那种微妙的相互影响与依赖关系，放张图片，看一下transformer模型的神秘面纱吧：

问：ChatGPT怎么收费？

答：好日子已经到头了，从发布到现在两个月的时间，基本上都是可以免费使用的，但是从2023年的2月份左右开始，open AI将会发布一个plus计划，每个月大概需要20美元，当然好处也是多多，那就是你的请求量可以很大，而且可以给你更快的响应速度，当然，如果x的GP有一些新的功能的话，你也是可以优先使用的，所以花钱也是有花钱的道理，但是我相信一定会爆卖的。

问：ChatGPT的“智商”到底怎么样？

答：首先要说的是是GP3.5模型已经通过了美国律师资格考试，注册会计师的考试以及美国医疗执照的考试，试问美国有多少的人可以同时通过这三项考试呢？另外，门萨国际的前主席曾经对GPT3的智商进行了估计，他估计ChatGPT在语言智商的测试环节中应该可以取得150分的高分，而实测的结果是147分，在这里我给大家再列举一张图，看一下GPT-3已经在哪些行业取得了哪样的成绩：

看看这个图是不是感觉ChatGPT强大的有点离谱啊，他可以立法，他可以判案，他可以通过商学院的MBA考试，他可以考取医师资格证书，他可以攻克亚马逊的AWS认证，在口语测试中智商更是高达147，而且在这几个案例中他的表现都已经优于了人类平均值，那这就基本可以验证一点，从综合的角度来看，ChatGPT的智商已经在人类中平均值之上，照这个势头发展下去，用不了几年，多数人在ChatGPT面前都是个“傻子”！

问：ChatGPT可靠吗？

答：其实上面的一个问题已经给出了一个答案，那就是在信息的正确率上，ChatGPT在多数情况下是对的，但是有大概百分之二三十，信息就不那么可靠了。前两天ChatGPT不是也出现了一个小小的“笑话”吗？有人让他同时评价川普和拜登，但是他在对拜登进行大加赞赏的同时，却拒绝评价川普，这就说明ChatGPT具体会给出怎样的答案，它背后的人是是有决断权的。另外OpenAI自己也表示，他们希望通过现实世界的经验与反馈，学习如何研发真正有用和可靠的人工智能，他们表示ChatGPT目前还没有那个实力，在任何事情上给出值得信赖的答案。

问：ChatGPT是否比GPT-3更强大？

答：这地方大家可能就有一个误区了，其实ChatGPT是GPT3这个模型的一个实际应用案例，我们用户是可以真正的看到ChatGPT的，因为它有比较漂亮的用户界面，我们可以实时的跟它进行交互，而对于GPT-3而言，我们只知道它是ChatGPT的一个基石，其实它可以给我们提供更多选择的对话模型以及大型语言模型库，说白了他们的关系就是，没有GPT-3就没有ChatGPT，但是没有ChatGPT，GPT-3依然存在。打个更加贴切的比方，那就是，如果你玩游戏的话，你应该知道虚幻引擎， GPT-3就是那个虚幻引擎，而ChatGPT则是基于虚幻引擎上实际开发出来的一个游戏而已。

问：我们可以在自己的本地运行ChatGPT或基于GPT-3模型进行训练吗？

答：理论上当然是可以的，但是这几个条件你看一看就可以了，对个人而言没有希望，对小公司而言也没有希望，只有大型的公司才有可能做到：

第一，硬件投资，为了能够训练1750亿个参数的GPT-3模型，你需要使用到大概1万张显卡以及285,000个CPU的核心，这种投资可以吓退99.99%的人，即使OpenAI自己也没有能力打造这套硬件设施，它是花了10亿美元从微软云上租用来的！猛不猛？爆不爆？
第二，人员配备，我们训练的目标肯定不能去训练别人已经训练过的东西，也就是别人吃过的东西，我们肯定不会再去吃了，所以为了训练出新的东西，我们需要世界上最聪明的博士级数据科学家，这又是一笔钱，没有几亿美元是拿不下来的，而且其实有钱也不一定能够请到这样的人。
第三，数据收集，凡是涉及到人工智能模型的训练，就需要海量海量的数据，数据从哪里来由谁来收集，这都是不确定的，又是一笔时间和金钱。
第四，真正的训练，假如说你是世界的超人，123条你都已经满足了，但是真正对模型训练也是需要花费时间的，像GPT-3这种规模的模型，需要大概9~12个月的时间，而且中间如果出现了一些问题，还需要对他进行多次训练，时间成本也是很高很高的。

问：ChatGPT是否会偷偷的复制保留数据？

答：其实你的数据，ChatGPT都看不上，他之所以现在如此强大的核心原因是，在大量时间的训练之后，它已经在数以万亿计的各种各样的词之间建立了关联，并保留了这些词汇之间“微妙”的连接，它早已经将原始数据都已经丢失了，也就是你知道的，他全都知道，你不知道的，他知道的更多，它能够在各种各样的问题上给出人性化的答案，并不是他记住了这些答案，而是建立了你问题所提出的那些文字之间的微妙的链接，基于这些链接，亦或是说神经网络或者是神经元吧，它可以真正地以接近人类大脑的方式给出自己的回复，一句话，他的强大不是靠死记硬背，所以就谈不上偷偷复制保留数据的问题了。

问：ChatGPT有类人人意识吗？

答：我相信这个问题好多人应该都挺关注的，大家可能都觉得ChatGPT如此强大，很有可能已经有了类似于人类的意识，其实现在想一想，完全没有可能，只要把电一断，一切凉凉。在上个问题中已经说了，它在数以万亿计的词语之间建立了微妙的关联，也就是它应该是一个非常强大的文本预测器，也就是在经过训练之后，当接收到新的文本之后，它可以预测到下一个文本，也就仅此而已，所以现在这个模型啊，我们暂时还不用担心，它完全是静态的，没有思想与意识。

阶段性汇总

其实看过了这几个问题之后，我想各位应该对ChatGPT，从科学的角度上，应该有了一个入门级的认知，如果让我总结上述几个问题得出的结论的话，那就是：

使用全球顶级的人才，使用全球顶级的算力，使用全球海量的数据，使用以年为单位的训练时间，去构建出，全球以万亿计的词汇的连接，ChatGPT当前在所有问题上的答案，都是以问题中的文本作为连接的入口，然后给出它的连接能够关联出的预测，而当下这个连接有多复杂，我们就只需要记住一个数字，1750亿。

我们的ChatGPT何时出现？

其实上面已经说了训练类似于GPT这种模型的一个要求，首先在硬件算力这块，我们肯定是没有任何问题的，这个毫无疑问，一万张GPU算什么，现在某鱼上的二手显卡，至少以百万张计，至于30万颗CPU核心，那更是毛毛雨。

其次在博士级数据科学家这块儿，这块真的不太好搞，因为我们的业务科学家比较多，但是数据科学家，说真的，没有听说过几个。说到这儿，其实我想给即将毕业的大学生们提一个建议，路已经很明确了，我们现在很缺少数据科学家，把数学学好，在这一行业成为一个科学家吧。

再次所谓的海量数据，对我们来说问题依然不大，因为我们人多力量大，每人产生一点数据，就可以甩国外几条街，当然前提是尽量多产生一点有意义有价值的数据。

最后就是那个训练时间，这个是最不需要成本的，虽然说时间就是金钱，但是我们完全可以从第1条硬件上，也就是从算力上去堆砌，一倍不行搞两倍，两倍不行搞10倍，机器多力量大，训练时间缩短那是必然的。

就说这么多吧，我是科技品鉴官，最近被网络上的ChatGPT刷屏刷到爆，也必须去仔细的了解一下ChatGPT到底是何方神圣，然后写了这篇小文总结了一下，希望可以帮助到大家，喜欢的话就点个赞，点个关注吧。

<<ChatGPT是什么？ChatGPT为什么这么火？

下载ChatGPT中文版安装使用教程国内如何使用ChatGPT中文版[多图]>>

拿来主义行不通！因为ChatGPT的这一点真不好拿！

你的可能疑问

阶段性汇总

我们的ChatGPT何时出现？

您可能还会对下面的文章感兴趣：

随便看看