百度：和 ChatGPT 差距不大，网友：真的吗？我不信

2023-03-29

　　最近，各家的 AI 大乱斗，看得狐妹有点眼花缭乱。

　　OpenAI 的 GPT-4，谷歌的 Bard、百度的文心一言……今年难不成就是天网元年？

　　不过，虽然这么多互联网大头都在争分夺秒地搞 AI，但哪家最强，相信大家都有目共睹。

　　然而最近，狐妹又看到了一则消息。

　　讲个笑话，狐妹百米冲刺和博尔特的差距也不大，也就几秒钟的距离。

　　* 真的就差这么一点点

　　在最近的一场极客直播里，李彦宏表示：

　　“我也不断在讲文心一言不够完美，事实上如果全面来评测的话，文心一言确实也不如现在最好的 ChatGPT 版本，但是差距不是很大。所谓不是很大，可能就是一两个月的差别。”

　　结果就在昨天，又传来了文心一言云服务发布会取消，改为闭门沟通会的消息。

　　虽然吧，狐妹是支持国产 AI 的，但百度说这话属实是有点夸张了。

　　一两个月的差别……对人来说似乎很短。

　　但对人工智能的发展速度而言，已经是落后了一大截了。

　　要知道，阿尔法狗一天能跟自己下一百万盘棋呢

　　狐妹觉得吧，不如别人的时候，还是低调点比较好。

　　少说话，多做事。

　　要是做好了产品，将来起码还可以打个漂亮的翻身仗。

　　就算没做好，也不至于因为吹牛被人嘲笑嘛。

　　那么，李彦宏口中的跟 ChatGPT 只有几个月差距的文心一言，真实水平到底如何？

　　狐妹的看法是，它虽然没你想象得那么好，但也没你想象得那么糟。

　　没记错的话，最近文心一言火出圈，是因为一言难尽的绘画技术。

　　不过 ChatGPT 目前还没有作画的功能，所以在这方面，也就不要嘲笑文心一言啦

　　，好歹人家也努力去画了。

　　那么在交流和问答方面，文心一言和 ChatGPT 谁更胜一筹呢？

　　下面是文心一言和 GPT 的正经版问答。

　　问：用“鲍威尔停下来”生成一首藏头诗。

　　文心一言的回答：

　　* 图源华尔街见闻

　　可以看出，文心一言更加理解“藏头诗”的意思，尽管顺序有误，但确实是一首藏头诗。

　　GPT-4 的回答：

　　* 图源华尔街见闻

　　GPT-4 或许不知道中文的藏头诗，不过它也很努力地“藏头”了，估计是英文诗歌里的藏头。

　　除此之外，GPT-4 写的诗里还包含着大家对鲍威尔加息的看法，似乎更有趣一点。

　　问：给扫地机器人起名字+写 600 字宣传文案

　　文心一言的回答：

　　* 图源 CSDN

　　文心一言好像忘记起名字了，不过文案倒是写得不错，写了 413 字，但跟 600 字好像还有点距离。

　　ChatGPT 的回答：

　　* 图源 CSDN

　　ChatGPT 基本达到了题目里的要求，给扫地机器人起了名字，并且写了 545 字的文案。

　　字数相比文心一言更多一点，更加靠近 600 字。

　　问：如何看待网友称文心一言的发布会是 PPT？（狐妹：夺笋哪）

　　文心一言的回答：

　　* 图源凤凰新闻

　　文心一言评价自己还挺客观的，自己也知道发布会没有太多的技术含量。

　　相比而言，ChatGPT 的回答就比较保守了，很有求生欲。

　　* 图源凤凰新闻

　　不过，如果是网友指定要它评价，那就没办法了。

　　* GPT-4 是懂阴阳的

　　对于那些正经一点的提问，文心一言和 ChatGPT 似乎没有拉开明显的差距。

　　但面对智力“远超”普通人的弱智吧，文心一言可能就没那么机灵了。

　　先看一波 GPT-4 的问答：

　　问：我女朋友的老公应该叫我什么？

　　GPT-4 ：？

　　* 图源左轮神医Doc

　　虽然很尴尬，但还是给出了礼貌的回答。

　　GPT-4 ：……

　　* 图源左轮神医Doc

　　这是把 GPT-4 卷入大型伦理剧中了吧，还好人家没上套。

　　问：跳多高才能跳过广告？

　　好家伙，把跳广告当跳高了是吧？

　　GPT-4 的回答：

　　* 图源 B 站网友

　　看来 GPT-4 是跳过广告的好手。

　　问：我是生产者还是消费者还是分解者？

　　能想出这种问题的人，也是人才啊。

　　GPT-4 ：

　　阻止不了你，但希望你注意卫生。

　　* 图源左轮神医Doc

　　甚至能翻译一些汉语十级题目。

　　翻译：“除了校徽别别别的。”

　　* 图源弱智吧

　　翻译：“我也想过过过儿过过的生活。”

　　* 图源弱智吧

　　居然都给它翻译对了，还真有两下子。

　　可以看出，GPT-4 还是很机灵的，没怎么上套。

　　再来看看文心一言：

　　问：耳机坏了，挂牙科还是耳科？

　　* 图源 B 站网友

　　文心一言：建议去看皮肤科。

　　问：只有联合国五常才能购买五常大米吗？

　　* 图源 B 站网友

　　看来，以后想吃五常大米，还要经过安理会全票通过才行，不然后果不堪设想。

　　五常大米，你很高贵吗？

　　问：我女朋友的老公应该叫我什么？

　　梅开二度，看看文心一言怎么回答？

　　* 图源 B 站网友

　　好家伙，直接从老公升级成岳父了是吧？

　　问：被五步蛇咬了倒退五步能把蛇反杀吗？

　　* 图源 B 站网友

　　笑死了，从未设想过的道路。

　　看不出来，文心一言才是深藏不露。

　　问：开水是不是钝角？

　　* 图源 B 站网友

　　在复读机式的追问下，逐渐迷失自我……

　　对于老六一点的问题，看来还是 GPT 更胜

　　一筹，文心一言很容易就被绕进去了。

　　在一些严肃的问答中，文心一言表现得还可以，不过稍微有点机械，有点像复制粘贴百度百科里的内容。

　　经过这些对比，可以看出，文心一言其实也没有咱们想象得那么糟糕。

　　但目前肯定是比不上 GPT-4 的。

　　相比之下，GPT-4 的表现的确令人惊喜。

　　百度发布文心一言，显然不是因为产品已经足够完善了，而是因为感受到了来自 ChatGPT 的压力，所以赶鸭子上架，推出了文心一言。

　　但很可惜，GPT-4 还是赶在了文心一言前一天发布，也让咱们有机会亲眼看到，什么是真正的降维打击。

　　对文心一言的期待值过高，导致当文心一言 PPT 和录播问答登场时，股价直接大跳水。

　　* 网友还根据股价分析了一波股东的心理

　　不得不说，资本的眼睛也是雪亮的，一个产品到底有没有价值，不是光靠嘴皮子说出来的。

　　但其实，除了对文心一言的调侃之外，狐妹也觉得十分的遗憾。

　　文心一言作为一个国产的 AI，它做不好，对我们来说很好笑吗？

　　虽然文心一言跟 GPT-4 没法比，但它也许真的是国内大厂能推出来的最好的 AI 产品了。

　　毕竟除了百度，也没看到国内第二家互联网大厂吱声了。

　　文心一言不仅仅代表了百度的水平，从它身上也可以看出，近些年来国内 AI 发展的真实情况。

　　* 2017 百度 AI 开发者大会

　　百度自 2010 年开始尝试在 AI 赛道上转型，此后陆陆续续推出百度网盘、百度翻译、百度地图等软件。

　　2017 年，李彦宏曾在《华尔街日报》主办的 WSJ.D Live 大会上表示：百度每年把 15% 的营收用于研发，大约为人民币 100 亿元，并且所有的投入都与 AI 有关。

　　如今，我们看到了这样大规模的“投入”下，最真实的结果。

　　很难不感到失望。

　　狐妹不禁想问一句，为什么？

　　我们没有财力吗？

　　肯定不是。

　　我们没有人力吗？

　　人家 Open AI 整个公司才 100 人左右，百度员工起码也有上万人吧。

　　我们没有时间吗？

　　Open AI 是 2015 年才成立的公司，而百度 2010 年就开始朝 AI 赛道发展，2017 年喊出 “All in AI” 的口号。

　　谁更早还真的说不定。

　　那为什么结果却不如人意？

　　狐妹只能说，在一个赚快钱、割韭菜的大环境下，还愿意沉下心来、长期投入并研发一个产品的公司不多了。

　　如果不是 ChatGPT 的发布，在 AI 界一石激起千层浪，恐怕文心一言仍然是个襁褓里的胎儿，多少年都等不到成熟的那一天。

　　不过吧，大家也不用光嘲笑文心一言，AI 产品拿不出手的大厂，又何止百度这一家

　　与百度相似，ChatGPT 推出之后，谷歌也是火急火燎地召开了聊天机器人 Bard 的发布会。

　　结果在发布会上，因为 Bard 答错了一个问题，导致谷歌股价开盘暴跌 8%，市值蒸发 1020 亿美元。

　　所以，GPT-4 已经在世界范围内遥遥领先了，咱们的文心一言比不上，也没什么特别丢人的。

　　总的来说，狐妹还是希望文心一言能够越来越好的，也希望百度不要当嘴强王者

　　在这个 AI 大战、你追我赶的时候，投入更多心思研发才是正道。

　　参考资料：

　　凤凰科技：李彦宏：百度每年投入100亿元用于研发，都与AI有关

　　搜狐科技：3.0时代的百度：八年AI，从幕前走向幕后

　　华尔街见闻：迎战Bing和ChatGPT 谷歌做了个“无聊”的Bard 故意的

　　华尔街见闻：我们同时问了GPT-4和文心一言10个问题，这是它们的回答

　　IT之家：GPT-4 发布后的第一道挑战，来自弱智吧

　　IT之家：百度李彦宏：文心一言和 ChatGPT 水平差距不是很大，也就一两个月

　　作者：小羽

<<元宇宙新鲜事｜马云谈ChatGPT：要用人工智能去解决问题百度“文心一言”已收到12万家

ChatGPT专题报告：解析ChatGPT背后的技术演进｜自然语言处理｜模型｜训练>>

百度：和 ChatGPT 差距不大，网友：真的吗？我不信

您可能还会对下面的文章感兴趣：

随便看看