cha

“文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见

  封面新闻记者 孟梅 欧阳宏宇

  在ChatGPT的“继任者”GPT-4发布一天之后,3月16日,百度在北京公开展示了新一代知识增强大语言模型、生成式AI产品“文心一言”。

  作为后来者,文心一言无法逃脱与ChatGPT对比的命运。此前,不少人认为百度是“全村的希望”,但也有网友用一张梗图表达了对文心一言的担忧。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图1)

  之所以如此,在于谷歌此前急炫AI搜索肌肉时暴露出了若干个瑕疵,导致了股价暴跌近8%;这次,在发布会进行的同时,百度港股市值也大幅下跌超9%。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图2)

  和ChatGPT一样,文心一言是一个多模态大模型,包括文学创作、商业文案创作、数理逻辑推算等能力。那么,这个中国版的ChatGPT到底实力如何?能否担得起“全村的希望”?记者对文心一言和ChatGPT进行了实测。

  中文检索准确度高

  文学创作偏理性

  在文学创作上,文心一言一开场就被提问《三体》的文学常识。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图3)

  看起来已是标准答案。再用同样的问题问ChatGPT呢?

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图4)

  延续了“一本正经”胡说八道的习惯:直接把刘慈欣的籍贯都给改了。

  下一个问题是对《三体》进行续写。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图5)

  看起来中规中矩,比较理性。然后是ChatGPT的答案。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图6)

  自古“文无第一”,你对谁的续写思路更有兴趣?

  能给公司起名字

  更懂中文背后的寓意

  接下来,文心一言展示了在商业文案创作上的能力。

  比如,给新公司起个名字,并且还强调这个名字是有寓意的。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图7)

  再看看ChatGPT的商业策划能力。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图8)

  看起来,ChatGPT对中文的理解还是相对肤浅。

  解小学奥数题无压力

  还知道出错了题

  数学计算能力是考验生成式大模型的一大难题。ChatGPT刚上线时,也翻了不少车。现场,文心一言被问到的是小学数学竞赛常见的鸡兔同笼问题。

  值得一提的是,现场展示的第一题题目出错了,文心一言也给与了及时反馈。修改了题目后,文心一言给出了详细的解题步骤。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图9)

  中文理解力更胜一筹

  英文能力稍欠缺

  作为扎根于中文世界的生成式AI,广大网友对文心一言的中华文化理解力寄予厚望。那么,其对中文的理解能力究竟如何?

  用“洛阳纸贵”分别问文心一言和ChatGPT。

  文心一言不但解释了成语及其来源,还阐释了背后的经济学原理。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图10)“文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图11)

  相比较而言,ChatGPT对中华文化的理解就要逊色一些。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图12)

  只不过在阐释经济学原理上,与文心一言能力相当。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图13)

  再看看双方写的藏头诗。

  文心一言的七绝略显得“打油”。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图14)

  ChatGPT给出的答案就更加离谱,似乎不理解“藏头诗”是什么含义。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图15)

  据介绍,在英文上,文心一言虽然也能处理,但能力是显著不如中文的。这或许和目前能用到的训练数据有关。

  不过,在发布会后,百度港股股价也有所回升。对此,文心一言还解释了个中缘由,不过话里话外都是“客观原因”。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图16)

  不服气的记者又问了一个关于“自己”的问题。答案却是……

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图17)

  怪不得不少网友对文心一言展示出的能力不太满意,甚至有人调侃,看完之后感觉“提前退休的日子看起来还可以缓一缓”。

  “文心一言”和ChatGPT谁更聪明?我们帮你试了试 | 封面天天见(图18)

  不过也有网友表示,希望能给国产产品多一点时间和耐心。

  在此之前,已经有超过650家生态合作伙伴宣布加入文心一言,包括封面新闻、环球时报等媒体,以及企业和机构组织。这款中国造ChatGPT究竟好不好用,能走多远,相信很快就会有答案。


您可能还会对下面的文章感兴趣:

登录 注册 退出