百度拿什么挑战GPT-4？

2023-03-15

　　GPT-4抢滩登陆，支持以图生文

　　距离发布仅四个多月，在ChatGPT展现了惊人的实力后，OpenAI又扔下一枚核弹：3月14日，人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。

　　该公司表示，GPT-4在许多专业测试中表现出超过绝大多数人类的水平。根据OpenAI实测，无论在全美统一律师资格考核上，还是在SAT数学测验或GRE测验等三十多项不同学科的主流测试中，GPT-4都大胜3.5版。

　　GPT-4在多种学科主流测试中表现优异

　　在今天的博文中，OpenAI写道：“GPT-4是一个大型多模态模型，是OpenAI努力扩展深度学习的最新里程碑。”

　　语言模型的多模态意味着什么？

　　这个模型可以管理不同语言数据的输入和输出，也能够同时输出文本、图像甚至视频，而目前的ChatGPT版本只能生成文本。

　　在《纽约时报》提供的案例中，GPT-4可以同时解析文本和图像，这也使它能够解释更复杂的信息。不过，目前图像输入的权限尚未公开，所以目前还没看到更多例子来证明GPT-4在图像方面的处理能力。

　　GPT-4可以解析复杂图像

　　即便如此，GPT4的多模态转向也将大幅提升AI视觉方向的生产效率，图像、视频等应用将层出不穷涌现。其使用场景将远不止于文字、问答与办公领域，未来有望拓展下游千行百业的应用空间，进一步打开市场的想象力。

　　“文心一言”发布会，明日重磅开启

　　值得注意的是，百度的类ChatGPT产品发布也进入倒计时，将于3月16日推出“文心一言”。这意味着，明天“文心一言”将与GPT-4正面对决。

　　百度官方今日表示，其让文心一言写了一封发布会的邀请函。文内表示，文心一言是百度研发的知识增强大语言模型，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。通过大语言模型，我们能有更多机会利用自然语言处理技术来改善生活和工作效率，推动人工智能领域的发展，带来更多的可能性。

　　本质上，“文心一言”是基于文心大模型推技术推出的生成式对话产品。也就是说，相较于GPT-4的多模态语言模型，“文心一言“只能生成文本。

　　至于“文心一言”在未来是否也会涉及到自动生成视频，也给人留下了想象空间。此前视频网站爱奇艺和百度宣布达成合作，爱奇艺将全面接入百度“文心一言”，双方共同探索将AIGC应用于爱奇艺内容搜索、内容宣发、内容创作工具等业务。

　　GPT-4代表了大模型能力更加多样化、全面化，如天风证券所说，GPT-4或许是生成式AI时代的“报晓鸟”。但遗憾的是，OpenAI的相关服务并没有开放给中国用户，即使在美国加州的IP地址下，中国本地手机号也无法注册ChatGPT账号。

　　一方面，GPT-4作为语言模型，在对语义的分析中可能会抓取一些涉及到国家安全的信息；另一方面AIGC（人工智能生成内容）本身具有较强的价值传播特性。因此，除了商业利益方面，GPT-4的使用、内容传播可能会对价值观和主流观点产生影响，甚至会触及国家安全问题。可以说，短期内GPT-4不太可能进入中国.

　　由于其背后公司的局限性，GPT-4在中文领域使用体验将远不如英文，所以百度占据地利优势，正如李彦宏所说，百度的文心大模型是中国市场非常本土化的大语言模型，这意味着百度现在正在研发的文心一言，将比国外开发的模型更适合中文和中国市场。

　　百度智能云方面也透露，“文心一言”背后的算力基础设施均由百度智算中心支持，后续百度多个智算中心也将为“文心一言”面向产业的规模化落地提供底层支撑。在百度阳泉智算中心内部，支撑“文心一言”的机房正在全力运转、测试，全力备战“文心一言”的发布。

　　国内AI领航者自当维护国产品牌尊严走在前列，“文心一言”或许不是十全十美的产品，或许使用效果不尽人意，但如果能够达到去年十一月ChatGPT的水平，将是目前国内断档式领先的水准，填补中国在对话型大模型方面的空白，实现从0到1 的突破。

<<王炸！微软发布Visual ChatGPT：视觉模型加持ChatGPT实现丝滑聊天

ChatGPT又一爆款发布，GPT>>

百度拿什么挑战GPT-4？

您可能还会对下面的文章感兴趣：

随便看看