恐怖如斯!最新ChatGPT 4.0 震撼发布,这次它居然都能考上斯坦福了!
是的,ChatGPT 4.0版本来了!
3月15日,OpenAI发布了ChatGPT-4版本的更新,并且打上了“most advanced”的tag,距离上次发布3.5版本,也就仅仅过去了半个月而已。
而且ChatGPT-4对比上一代确实进步的不是一点点!
加入图片识别功能
和外界此前的猜测一样,GPT-4是一个多模态大型语言模型,不再仅仅处理文本数据,对图片也有了理解能力。
但相比于此前各大科技公司推出的多模态模型,GPT-4可以说是遥遥领先。
虽然官方表示,GPT-4现在只开放了文字输入的功能,图片输入功能还在加紧开发中。
但在官方的文章中,OpenAI给出了几个使用范例,如说明图片的内容、分析图表、解答图片内的考题、找出图片不寻常的原因等,已经让人大开眼界。
在OpenAI官方发布的视频中,GPT-4通过识别上图中随便画出的草图,就识别出了这是一个关于网站的草图;
然后“顺手”生成了建成这个网页的全部代码,再然后...一个网站就这样建成了。
强大的推理能力
还有一个官方示例也值得一提,当被问到下图的笑点在哪里时,GPT-4的回答更是让人惊叹:
“这张图片中的幽默来自于将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法”
从这一回答中可以看出,GPT-4所具备的推理能力已经有了大幅度提高。
一直以来,人工智能虽然表现出了强大的能力,但逻辑推理依然是人类区别于AI的最显著特征。
而GPT-4表现出的逻辑和推理能力,需要所有人开始重新思考人类区别于AI的本质到底是什么。
支持更长的输入和输出
相比于ChatGPT,GPT-4可接受的文字输入长度增加到3.2万个Token,约2.4万单词,同时也支持更长的输出,大约能处理长达25000字的文本。
这使得更多的应用场景变为可能,例如长文本的创建、超长对话和文档的搜寻和分析等,仅需一次对话,就足够写一部剧本或者短篇小说了。
考试能力超过90%人类
对于GPT-4来说,最强的并不是视觉能力的加入,因为很多的多模态模型早就已经做出了类似的功能,其最亮眼的功能是它所表现出的推理能力。
在GRE、SAT和美国法学院考试等我们较为熟悉的美国考试中,GPT-4的得分几乎和人类考生没有区别了。
其中,GPT-4在模拟律师考试的成绩在考生中排名前10%左右,在SAT阅读考试中排名前7%左右,在SAT数学考试中排名前11%左右。
在GRE考试中的数学部分,满分是170分,GPT-4获得163分,而上一代GPT-3.5得分为147分,在GRE语言部分,GPT-4得分为169分,GPT-3.5得分为154分。
也就是说,GPT-4已经可以靠自己考上斯坦福大学。
支持更多语言
许多现有的机器翻译的基准测试都是用英语编写的。
而为了初步了解 GPT-4 在其他语言上的能力,OpenAI的研究团队还使用Azure Translate将MMLU基准翻译成多种语言。
这套基准涵盖了57个主题的14000个多项选择题 ,在测试的26种语言的24种中,GPT-4全部优于GPT-3.5和其他大语言模型。
以上这些也仅仅只是OpenAI官方示例的一小部分。
OpenAI的总裁和联合创始人还展示了GPT-4有关总结文章、写代码、报税、写诗等一系列能。
可以说GPT-3.5做不到的, GPT-4大都可以轻松解决。