恐怖如斯！最新ChatGPT 4.0 震撼发布，这次它居然都能考上斯坦福了！

2023-03-18

　　是的，ChatGPT 4.0版本来了！

　　3月15日，OpenAI发布了ChatGPT-4版本的更新，并且打上了“most advanced”的tag，距离上次发布3.5版本，也就仅仅过去了半个月而已。

　　而且ChatGPT-4对比上一代确实进步的不是一点点！

　　加入图片识别功能

　　和外界此前的猜测一样，GPT-4是一个多模态大型语言模型，不再仅仅处理文本数据，对图片也有了理解能力。

　　但相比于此前各大科技公司推出的多模态模型，GPT-4可以说是遥遥领先。

　　虽然官方表示，GPT-4现在只开放了文字输入的功能，图片输入功能还在加紧开发中。

　　但在官方的文章中，OpenAI给出了几个使用范例，如说明图片的内容、分析图表、解答图片内的考题、找出图片不寻常的原因等，已经让人大开眼界。

　　在OpenAI官方发布的视频中，GPT-4通过识别上图中随便画出的草图，就识别出了这是一个关于网站的草图；

　　然后“顺手”生成了建成这个网页的全部代码，再然后...一个网站就这样建成了。

　　强大的推理能力

　　还有一个官方示例也值得一提，当被问到下图的笑点在哪里时，GPT-4的回答更是让人惊叹：

　　“这张图片中的幽默来自于将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法”

　　从这一回答中可以看出，GPT-4所具备的推理能力已经有了大幅度提高。

　　一直以来，人工智能虽然表现出了强大的能力，但逻辑推理依然是人类区别于AI的最显著特征。

　　而GPT-4表现出的逻辑和推理能力，需要所有人开始重新思考人类区别于AI的本质到底是什么。

　　支持更长的输入和输出

　　相比于ChatGPT，GPT-4可接受的文字输入长度增加到3.2万个Token，约2.4万单词，同时也支持更长的输出，大约能处理长达25000字的文本。

　　这使得更多的应用场景变为可能，例如长文本的创建、超长对话和文档的搜寻和分析等，仅需一次对话，就足够写一部剧本或者短篇小说了。

　　考试能力超过90%人类

　　对于GPT-4来说，最强的并不是视觉能力的加入，因为很多的多模态模型早就已经做出了类似的功能，其最亮眼的功能是它所表现出的推理能力。

　　在GRE、SAT和美国法学院考试等我们较为熟悉的美国考试中，GPT-4的得分几乎和人类考生没有区别了。

　　其中，GPT-4在模拟律师考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。

　　在GRE考试中的数学部分，满分是170分，GPT-4获得163分，而上一代GPT-3.5得分为147分，在GRE语言部分，GPT-4得分为169分，GPT-3.5得分为154分。

　　也就是说，GPT-4已经可以靠自己考上斯坦福大学。

　　支持更多语言

　　许多现有的机器翻译的基准测试都是用英语编写的。

　　而为了初步了解 GPT-4 在其他语言上的能力，OpenAI的研究团队还使用Azure Translate将MMLU基准翻译成多种语言。

　　这套基准涵盖了57个主题的14000个多项选择题，在测试的26种语言的24种中，GPT-4全部优于GPT-3.5和其他大语言模型。

　　以上这些也仅仅只是OpenAI官方示例的一小部分。

　　OpenAI的总裁和联合创始人还展示了GPT-4有关总结文章、写代码、报税、写诗等一系列能。

　　可以说GPT-3.5做不到的， GPT-4大都可以轻松解决。