cha

百度:和 ChatGPT 差距不大,网友:真的吗?我不信

  最近,各家的 AI 大乱斗,看得狐妹有点眼花缭乱。

  OpenAI 的 GPT-4,谷歌的 Bard、百度的文心一言……今年难不成就是天网元年?

  不过,虽然这么多互联网大头都在争分夺秒地搞 AI,但哪家最强,相信大家都有目共睹。

  然而最近,狐妹又看到了一则消息。

  讲个笑话,狐妹百米冲刺和博尔特的差距也不大,也就几秒钟的距离。

  * 真的就差这么一点点

  在最近的一场极客直播里,李彦宏表示:

  “我也不断在讲文心一言不够完美,事实上如果全面来评测的话,文心一言确实也不如现在最好的 ChatGPT 版本,但是差距不是很大。所谓不是很大,可能就是一两个月的差别。”

  结果就在昨天,又传来了文心一言云服务发布会取消,改为闭门沟通会的消息。

  虽然吧,狐妹是支持国产 AI 的,但百度说这话属实是有点夸张了。

  一两个月的差别……对人来说似乎很短。

  但对人工智能的发展速度而言,已经是落后了一大截了。

  要知道,阿尔法狗一天能跟自己下一百万盘棋呢

  狐妹觉得吧,不如别人的时候,还是低调点比较好。

  少说话,多做事。

  要是做好了产品,将来起码还可以打个漂亮的翻身仗。

  就算没做好,也不至于因为吹牛被人嘲笑嘛。

  那么,李彦宏口中的跟 ChatGPT 只有几个月差距的文心一言,真实水平到底如何?

  狐妹的看法是,它虽然没你想象得那么好,但也没你想象得那么糟。

  没记错的话,最近文心一言火出圈,是因为一言难尽的绘画技术。

  不过 ChatGPT 目前还没有作画的功能,所以在这方面,也就不要嘲笑文心一言啦

  ,好歹人家也努力去画了。

  那么在交流和问答方面,文心一言和 ChatGPT 谁更胜一筹呢?

  下面是文心一言和 GPT 的正经版问答。

  问:用“鲍威尔停下来”生成一首藏头诗。

  文心一言的回答:

  * 图源华尔街见闻

  可以看出,文心一言更加理解“藏头诗”的意思,尽管顺序有误,但确实是一首藏头诗。

  GPT-4 的回答:

  * 图源华尔街见闻

  GPT-4 或许不知道中文的藏头诗,不过它也很努力地“藏头”了,估计是英文诗歌里的藏头。

  除此之外,GPT-4 写的诗里还包含着大家对鲍威尔加息的看法,似乎更有趣一点。

  问:给扫地机器人起名字+写 600 字宣传文案

  文心一言的回答:

  * 图源 CSDN

  文心一言好像忘记起名字了,不过文案倒是写得不错,写了 413 字,但跟 600 字好像还有点距离。

  ChatGPT 的回答:

  * 图源 CSDN

  ChatGPT 基本达到了题目里的要求,给扫地机器人起了名字,并且写了 545 字的文案。

  字数相比文心一言更多一点,更加靠近 600 字。

  问:如何看待网友称文心一言的发布会是 PPT?(狐妹:夺笋哪)

  文心一言的回答:

  * 图源凤凰新闻

  文心一言评价自己还挺客观的,自己也知道发布会没有太多的技术含量。

  相比而言,ChatGPT 的回答就比较保守了,很有求生欲。

  * 图源凤凰新闻

  不过,如果是网友指定要它评价,那就没办法了。

  * GPT-4 是懂阴阳的

  对于那些正经一点的提问,文心一言和 ChatGPT 似乎没有拉开明显的差距。

  但面对智力“远超”普通人的弱智吧,文心一言可能就没那么机灵了。

  先看一波 GPT-4 的问答:

  问:我女朋友的老公应该叫我什么?

  GPT-4 :?

  * 图源左轮神医Doc

  虽然很尴尬,但还是给出了礼貌的回答。

  GPT-4 :……

  * 图源左轮神医Doc

  这是把 GPT-4 卷入大型伦理剧中了吧,还好人家没上套。

  问:跳多高才能跳过广告?

  好家伙,把跳广告当跳高了是吧?

  GPT-4 的回答:

  * 图源 B 站网友

  看来 GPT-4 是跳过广告的好手。

  问:我是生产者还是消费者还是分解者?

  能想出这种问题的人,也是人才啊。

  GPT-4 :

  阻止不了你,但希望你注意卫生。

  * 图源左轮神医Doc

  甚至能翻译一些汉语十级题目。

  翻译:“除了校徽别别别的。”

  * 图源弱智吧

  翻译:“我也想过过过儿过过的生活。”

  * 图源弱智吧

  居然都给它翻译对了,还真有两下子。

  可以看出,GPT-4 还是很机灵的,没怎么上套。

  再来看看文心一言:

  问:耳机坏了,挂牙科还是耳科?

  * 图源 B 站网友

  文心一言:建议去看皮肤科。

  问:只有联合国五常才能购买五常大米吗?

  * 图源 B 站网友

  看来,以后想吃五常大米,还要经过安理会全票通过才行,不然后果不堪设想。

  五常大米,你很高贵吗?

  问:我女朋友的老公应该叫我什么?

  梅开二度,看看文心一言怎么回答?

  * 图源 B 站网友

  好家伙,直接从老公升级成岳父了是吧?

  问:被五步蛇咬了倒退五步能把蛇反杀吗?

  * 图源 B 站网友

  笑死了,从未设想过的道路。

  看不出来,文心一言才是深藏不露。

  问:开水是不是钝角?

  * 图源 B 站网友

  在复读机式的追问下,逐渐迷失自我……

  对于老六一点的问题,看来还是 GPT 更胜

  一筹,文心一言很容易就被绕进去了。

  在一些严肃的问答中,文心一言表现得还可以,不过稍微有点机械,有点像复制粘贴百度百科里的内容。

  经过这些对比,可以看出,文心一言其实也没有咱们想象得那么糟糕。

  但目前肯定是比不上 GPT-4 的。

  相比之下,GPT-4 的表现的确令人惊喜。

  百度发布文心一言,显然不是因为产品已经足够完善了,而是因为感受到了来自 ChatGPT 的压力,所以赶鸭子上架,推出了文心一言。

  但很可惜,GPT-4 还是赶在了文心一言前一天发布,也让咱们有机会亲眼看到,什么是真正的降维打击。

  对文心一言的期待值过高,导致当文心一言 PPT 和录播问答登场时,股价直接大跳水。

  * 网友还根据股价分析了一波股东的心理

  不得不说,资本的眼睛也是雪亮的,一个产品到底有没有价值,不是光靠嘴皮子说出来的。

  但其实,除了对文心一言的调侃之外,狐妹也觉得十分的遗憾。

  文心一言作为一个国产的 AI,它做不好,对我们来说很好笑吗?

  虽然文心一言跟 GPT-4 没法比,但它也许真的是国内大厂能推出来的最好的 AI 产品了。

  毕竟除了百度,也没看到国内第二家互联网大厂吱声了。

  文心一言不仅仅代表了百度的水平,从它身上也可以看出,近些年来国内 AI 发展的真实情况。

  * 2017 百度 AI 开发者大会

  百度自 2010 年开始尝试在 AI 赛道上转型,此后陆陆续续推出百度网盘、百度翻译、百度地图等软件。

  2017 年,李彦宏曾在《华尔街日报》主办的 WSJ.D Live 大会上表示:百度每年把 15% 的营收用于研发,大约为人民币 100 亿元,并且所有的投入都与 AI 有关。

  如今,我们看到了这样大规模的“投入”下,最真实的结果。

  很难不感到失望。

  狐妹不禁想问一句,为什么?

  我们没有财力吗?

  肯定不是。

  我们没有人力吗?

  人家 Open AI 整个公司才 100 人左右,百度员工起码也有上万人吧。

  我们没有时间吗?

  Open AI 是 2015 年才成立的公司,而百度 2010 年就开始朝 AI 赛道发展,2017 年喊出 “All in AI” 的口号。

  谁更早还真的说不定。

  那为什么结果却不如人意?

  狐妹只能说,在一个赚快钱、割韭菜的大环境下,还愿意沉下心来、长期投入并研发一个产品的公司不多了。

  如果不是 ChatGPT 的发布,在 AI 界一石激起千层浪,恐怕文心一言仍然是个襁褓里的胎儿,多少年都等不到成熟的那一天。

  不过吧,大家也不用光嘲笑文心一言,AI 产品拿不出手的大厂,又何止百度这一家

  与百度相似,ChatGPT 推出之后,谷歌也是火急火燎地召开了聊天机器人 Bard 的发布会。

  结果在发布会上,因为 Bard 答错了一个问题,导致谷歌股价开盘暴跌 8%,市值蒸发 1020 亿美元。

  所以,GPT-4 已经在世界范围内遥遥领先了,咱们的文心一言比不上,也没什么特别丢人的。

  总的来说,狐妹还是希望文心一言能够越来越好的,也希望百度不要当嘴强王者

  在这个 AI 大战、你追我赶的时候,投入更多心思研发才是正道。

  参考资料:

  凤凰科技:李彦宏:百度每年投入100亿元用于研发,都与AI有关

  搜狐科技:3.0时代的百度:八年AI,从幕前走向幕后

  华尔街见闻:迎战Bing和ChatGPT 谷歌做了个“无聊”的Bard 故意的

  华尔街见闻:我们同时问了GPT-4和文心一言10个问题,这是它们的回答

  IT之家:GPT-4 发布后的第一道挑战,来自弱智吧

  IT之家:百度李彦宏:文心一言和 ChatGPT 水平差距不是很大,也就一两个月

  作者:小羽


您可能还会对下面的文章感兴趣:

登录 注册 退出