最新:刚刚发布的GPT
【通信产业网讯】(记者 崔亮亮)美东时间3月14日,ChatGPT的开发机构OpenAI正式发布GPT-4(Generative Pre-trained Transformer 4)。
GPT-4是一个多模态大模型(接受图像和文本输入,生成文本)。相比上一代的GPT-3,GPT-4可以更准确地解决难题,具有更广泛的常识和解决问题的能力;更强大的识图能力;更具创造性和协作性;允许长文内容创建、扩展对话以及文档搜索和分析;能够生成歌词、创意文本,实现风格变化。
虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平的表现。
在SAT等绝大多数专业测试以及相关学术基准评测中,GPT-4的分数高于ChatGPT。
GPT-4通过了模拟的律师考试,分数约为全部应试者的前10%。而相比之下,GPT-3.5的分数大约是后10%。“我们团队花了6个月时间,利用对抗性测试项目以及基于ChatGPT的相关经验,反复对GPT-4进行调整。结果是,GPT-4在事实性(factuality)、可引导性(steerability)和拒绝超范围解答(非合规)问题方面取得了有史以来最好的结果(尽管它还不够完美)。”
GPT官方发布较以往版本主要三大突破:
一是,像人一样更具备创作协作输出能力。GPT-4具备更有创作性的写作能力,包括编歌曲、写剧本、学习用户写作风格。
二是,像人一样具备视觉输入处理分析能力。可以图文等多模态同时综合分析,给出答案。
三是,像人一样具备超长文本的处理分析能力。能够处理超过2.5万个单词的文本。
OpenAI表示,在过去两年里,他们重构了整个深度学习堆栈,并与Azure(微软云服务)合作,共同设计了一台超级计算机。一年前,OpenAI训练了GPT-3.5,作为整个系统的首次“试运行”。他们发现并修复了一些错误,改进了之前的理论基础。“因此,我们的GPT-4训练、运行空前稳定,成为我们首个训练性能可以进行提前准确预测的大模型。随着我们继续专注于可靠扩展,中级目标是磨出方法,以帮助OpenAI能够持续提前预测未来,并且为未来做好准备,我们认为这一点对安全至关重要。”
OpenAI花了6个月时间使GPT-4更安全、更具一致性。在内部评估中,与GPT-3.5相比,GPT-4对不允许内容做出回应的可能性降低82%,给出事实性回应的可能性高40% 。GPT-4引入了更多人类反馈数据进行训练,不断吸取现实世界使用的经验教训进行改进。
不过,OpenAI表示,GPT-4仍然有许多正在解决的局限性,例如社会偏见、幻觉和对抗性prompt(提示)。
此外,OpenAI还开源了OpenAI?Evals,这是其用于自动评估AI模型性能的框架。OpenAI表示,此举是为了让所有人都可以指出其模型中的缺点,以帮助OpenAI进一步改进模型。
目前,OpenAI在付费版的ChatGPT Plus上提供GPT-4,并为开发人员提供API以构建应用和服务。值得一提的是,微软的新必应(New Bing)早就用上了GPT-4。
“GPT-4 是世界第一款高体验,强能力的先进AI系统,我们希望很快把它推向所有人。”OpenAI工程师在介绍视频里说。
特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。