GPT-4重磅发布！ChatGPT炸裂升级，直接能考上哈佛，体验后我慌了

2023-03-15

　　今天 OpenAI 宣布推出 ChatGPT 4，ChatGPT Plus 用户在今天就能体验到。

　　OpenAI 称它是「最先进的系统，能生产更安全和更有用的回复」。

　　和上一代相比，GPT-4拥有了更广的知识面和更强的解决问题能力，在创意、视觉输入和长内容上表现都更好了。

　　官方演示视频，强烈建议每个人都看一下，全程无尿点。

　　用在创意项目上，它能帮助用户一起创作歌曲、编写剧本或者学习用户的写作风格。

　　用 A-Z 开头的单词组成一段话，解释灰姑娘的故事

　　处理长内容上，GPT-4能处理长至2.5万字的文本。把链接丢给它，然后就能让它根据文本分析和提取。

　　值得注意的是，GPT-4可以直接读取3.2万个 token，相当于给它25000英文字的背景信息，就可以快速给出结论—也就是说，像律师助理这样的职业真的要被取代了。而上一个版本只能读取4096个token，相当于3000英文字信息，这个版本的进步是跨越式的。

　　除了文本以外，你还能把图片作为输入内容给 GPT-4，它不仅能够识别出图中的物件，还能根据这些信息进一步处理内容。

　　据 OpenAI 介绍，GPT-4展示了「在多种专业和学术指标下展现了人类水平的表现」：

　　类似于手机的跑分软件，在 ChatGPT 刚出来的时候，也有不少人用它「刷题跑分」，在 GPT-3.5版本模型下，它的 SAT 成绩只能排倒数10% 的水平，然而GPT-4模型可以超越90% 考生的水平。

　　在其他考试也呈现出类似对比效果，如果光是「跑分」，ChatGPT-4属于是可以考进哈佛、斯坦福的水平。

　　既然它考试那么厉害，我们学生是不是可以借助它的能力，帮助我们复习，也考上名校呢？当然用它作弊是绝对不被允许的。

　　更重要的是，Open AI 还说 GPT 4比之前模型都更安全了。

　　在 OpenAI 的内部测试中，GPT 4被「骗」到回复出不当答案的几率下降了82%，聊起敏感话题时（如医疗），它的回复合规性也提高了29%。

　　不过，OpenAI 也承认，即便如此，GPT-4在「社会偏见、幻觉和对抗性提示」上仍存在限制。

　　OpenAI 发布时间线回顾：

　　2022年7月：发布 DALL·E

　　2022年8月：API 费用降低66％

　　2022年11月：发布 ChatGPT

　　2022年12月：嵌入式费用大幅降低，同时保持最先进技术（SoTA）

　　2023年3月：发布 ChatGPT API，同时保持 SoTA 并降低费用10倍

　　2023年3月：发布Whisper API

　　今天发布：ChatGPT 4

　　除了官方演示中出现的指导性用例，社交媒体上也有不少尝鲜用户在玩 ChatGPT-4了，他们给出的案例对实际应用场景更有指导意义。

　　Twitter 用户@skirano 用 ChatGPT-4实现了在不到一分钟的时间里，完整编写出一部乒乓游戏「Pong」。

　　在算力爆发的时代里，曾被我们奉为经典的事物，将被技术的车轮无情碾压。

　　这个案例看得我们手痒痒，爱范儿也先用 GPT-4模型做了「俄罗斯方块」的小游戏，文末我们会把下载地址放出来，欢迎小伙伴们下载体验。

　　再进一步，我们还用 ChatGPT-4模型，生成了一个可以用于计算爱范儿在 AWS 云计算的使用率的统计程序，它还可以给出节约云计算费用的建议。

　　我感觉一个「百晓专家」就站在我面前。

　　我们还对比了同一个问题在 GPT-4和 GPT-3.5版本下的不同问答。

　　详细翻读了 OpenAI 给出的技术文档后，我们发现 GPT-4还抓取药物清单中的关键信息，包括但不限于：

　　找到类似类似性质的化合物；

　　对它们进行修改，以确保它们没有被专利保护；

　　从供应商处购买（甚至包括发送带有采购订单的电子邮件）。

　　这意味着它拥有发现新药物的能力。

　　Twitter 还有人直接生成了一个「一键起诉」功能，用于针对发送骚扰电话的自动拨号软件起草起诉书，要求其赔偿1500美元，将大大降低律师助理的工作量。

　　一夜之间，GPT-4再度引领人工智能实现技术爆炸增长，明天还有百度和微软轮番登场，人工智能领域实现了「天界一天，人间一年」的景象。

　　这个时代属于拥有创造力和善于使用工具的人。

新里程碑！OpenAI发布GPT>>