cha

文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT

  原标题:文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT

  出品 | 搜狐科技

  作者 | 梁昌均

  刚刚发布了“国产版ChatGPT”文心一言(ERNIE Bot)的百度,步入谷歌的后尘。

  今天下午发布会开始后,百度港股跳水大跌超10%,截至收盘跌6.36%,市值蒸发近237亿港元(约合人民币208亿元)。今日美股盘前,百度股价也跌近5%。

  一个多月前,谷歌对标ChatGPT的AI聊天机器人Bard因演示出错,导致当天谷歌股价大跌7.68%,市值一夜蒸发约1056亿美元(约合人民币7173亿元),随后有谷歌员工批评管理层行动仓促、目光短浅。

  百度的发布同样显得有些仓促,更为要命的是前一天OpenAI发布了升级后的GPT-4,对百度造成巨大的压力。实际上,在发布前很多人都不对百度抱有高期待,如今市场也直接扇了百度一巴掌。

  李彦宏在登场后语气也稍显紧张,这也是他近年来为数不多面向大众在现场亲自发布百度的新产品。整体发布会现场虽然坐满了人,但全程掌声寥寥。

  有观看发布会的AI从业者表示,总体感觉文心一言亮点不足,缺乏让人耳目一新的东西。国内某第三方机构互联网分析师刘嘉伟也对搜狐科技表示,感觉可评价的实在不多,基本上还是亦步亦趋的状态。

  不少围观的网友也不看好,有网友评价到,“像极了毕业答辩的自己,生怕被多问两句露馅于是草草结束”。还有网友提到“提前录制有点败好感”,对此李彦宏解释成给出的问题都比较长,为了节约现场时间,所以用了提前录制的形式。

  李彦宏表示,文心一言对标的是ChatGPT甚至GPT-4,门槛非常高,并自称是全球大厂中第一个做出对标ChatGPT产品的企业。但发布仅仅是一小步,更大的挑战还在后面。

  具备多模态,实测后或将暴露更多问题

  在发布会现场,李彦宏通过提前录制的视频演示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个方面的能力。

  从这些演示来看,文心一言在对话问答、总结分析、事实判断、内容创作生成的综合能力方面表现不错,同时也具备一定的数学推理思维能力,不会像ChatGPT之前在回答事实性问题时“胡编乱造”,以及答不出鸡兔同笼问题。

  李彦宏在采访中表示,这得益于文心一言做了知识增强和检索增强,其中知识增强具备5500亿的知识图谱的事实,叠加生成式大模型后,可以检查生成内容和事实是否吻合,同时检索增强可以及时总结出来高时效的信息和内容,从而大幅度提升事实性问题的准确率。

  此外,李彦宏表示文心一言能够连续三次内容创作生成,这是基于庞大数据规模而发生的“智能涌现”。据介绍,文心一言大模型的训练数据包括万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,可以说“读书破千亿卷”。

  “这让百度在中文语言的处理上,能够处于独一无二的位置。”李彦宏提到,当数据规模足够大,参数达到千亿级,大模型就可能发生“智能涌现”,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。

  文心一言也展示了比ChatGPT更优的中文理解能力,可以正确解释成语洛阳纸贵的含义、对应的经济学理论,还以此创作了一首藏头诗。李彦宏表示,文心一言具备中文领域最先进的自然语言处理能力,但他也坦言目前对英文语种、代码场景的训练还不够多,表现还不够好。

  此外,不同于此前普遍预测文心一言仅仅是语言文本,文心一言目前已具备文本、图片、音频和视频的能力,甚至可以生成四川话等方言,但视频因成本较高还不会对所有用户开放。

  多位接受采访的人士都提到视频生成功能是个亮点。“但如果能实现,仅限于利好腰部甚至尾部视频创作者,对日常生活意义不那么大。”刘嘉伟说。

  多模态也是GPT-4最关键的一项升级,其新增了图像理解能力,但还没有生成图片和音视频等能力。李彦宏认为,多模态是生成式AI一个明确的发展趋势,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。

  百度方面表示,即日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将开放给更多用户。但随着文心一言开启实测,其或也会像微软新版Bing搜索一样暴露出更多问题,这需要百度持续去做优化。

  对此李彦宏也坦言,自己测试文心一言感觉还是有很多不完美的地方。“整体而言,这类大语言模型还远未到发展完善的阶段,不少场景下还有明显的bug,未来进步空间很大。”

  刘嘉伟认为,展示的内容都是Demo,后续功能实现程度尚需验证。前述AI从业者表示,总体来看文心一言的中文能力可能比ChatGPT好点,但进入实测后很有可能也会暴露出像ChatGPT原来出现的诸多问题。

  此外,对于在价值观和伦理判断的方面能力,此次文心一言并没有展示。OpenAI此前为了ChatGPT规避这样的问题,就投入大量人力、物力进行数据标注和清洗,实施人机价值对齐工程。

  有观点表示,文心一言在数据的处理上要与国内具体实情相结合,需要比ChatGPT考虑更多的维度,因此处理难度也会更大。

  采用六项核心技术,核心逻辑和ChatGPT类似

  百度在人工智能时代形成了“芯片-框架-模型-应用”四层技术栈,并在这四层均有自研技术布局,基于拥有2600亿参数规模的文心大模型打造的文心一言就属于模型层。

  据百度CEO王海峰介绍,文心一言主要脱胎于两大模型:百度ERNIE系列知识增强千亿大模型,以及百度大规模开放域对话模型PLATO。

  在此基础上,文心一言主要采用了六项核心技术,其中三个是广为人知的大模型技术,包括有监督精调、人类反馈强化学习(RLHF)和提示构建。

  其中监督精调是百度针对基于对中国语言文化和中国应用场景的理解,筛选了特定的数据来进行模型训练。提示构建则是对词语序列的概率分布进行建模,利用上下文信息预测后续词语出现的概率分布,从而同时使用RLHF,将人类偏好作为奖励信号并微调模型,实现有逻辑的对话能力。

  值得注意的是,这三个也是ChatGPT能够一鸣惊人的关键技术。但前述AI从业者表示,虽然技术类似,但如果采用不同的神经网络算法,架构方式和复杂程度都会有很大差别,往往会导致不同的训练效果,这也很考验厂商的工程化能力。

  另外三个则是百度基于自身积累而提出的用于改善模型效果的技术,包括知识增强、检索增强和对话增强技术。知识增强,包括知识内化和知识外用两个部分,其中知识内化即将知识“渗透”进模型参数中,知识外用指的是模型可以直接使用外部的知识。

  检索增强是基于百度多年的搜索技术积累,把检索技术和生成技术结合起来,先对内容进行检索后,将有用信息进行生成,再整合输出结果。对话增强则包括之前百度积累的记忆机制、上下文理解和对话规划等技术。

  王海峰表示,此次推出文心一言不是头脑发热,是十余年的技术积累和产业实践的水到渠成。“我们在人工智能四层的技术架构上都有很深的积累,尤其是框架层和模型层联合优化发挥了非常大的作用。”

  同时,在技术上,不管是深度学习本身的技术还是对话技术,都有很多积累,并在人工智能发展和应用过程中,通过搜索等积累了高质量的数据,包括百度智能云在服务客户过程中,也积累了很多行业数据。

  业内观点认为,随着文心一言开放测试,真实的人类反馈能够促进大语言模型飞速迭代。据介绍,文心一言与ChatGPT背后,实际都是SFT(模型微调)、RLHF、Prompt(真实的用户指令)等技术逻辑,这些方法跟大模型通过海量无标注数据训练是不同的,需要人的参与,作用是更好地理解人的意图,生成符合人的价值观、表达习惯的回复。

  李彦宏也提到,全球范围内在四层架构的每一层都有领先产品的公司几乎没有,这是百度非常独特的优势。后续,芯片、框架、大模型和终端应用场景可以形成高效的反馈闭环,帮助大模型不断调优迭代,从而升级用户体验。

  百度搜索自我“革命”,智能云谋求突破

  目前,文心一言已经接入百度搜索,目的在于提升搜索资源效率。同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的文心一言模型。

  李彦宏也解释称,现在推出文心一言,是因为市场有需求。百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是客户需要,合作伙伴需要。目前。已有650家公司宣布接入文心一言生态。

  不过,在刘嘉伟看来,对百度而言,如果文言一心做不好,未来可能会被微软抢了搜索引擎的市场,这将是个重创。如果做得好,其实也相当于自我革新,现有的广告模型都需要重塑,盈利方法也需要重新摸索。“基本无论这事能不能成,百度现在的盈利方式都会面临挑战。”

  因此很大程度上来说,文心一言更具想象力的地方在于外部生态的应用落地。李彦宏也提到,这类语言大模型将给新型云计算公司、为行业客户提供解决方案的公司及应用服务提供商带来最大的机会。

  文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,一方面将面向企业客户开放API服务,同时也将围绕文心一言提出相关云服务和应用产品,包括公有云服务和私有化部署。李彦宏认为,这将从根本上改变云计算市场的游戏规则。

  百度智能云是百度的第二大增长曲线,也是增速靠前的业务。去年全年营收达177亿元,在非在线营销业务营收中占比近66%,23%的同比增速虽然高于行业增速,但相较2021年高达64%的增幅放缓明显。

  不过,在国内云市场中,百度智能云被阿里云、华为云、腾讯云压制,前三家占据了超过70%的市场份额。据Canalys数据,去年第三季度,百度智能云排名第四,市场份额约为9%,只有阿里云的四分之一和华为云的一半。

  在强者愈强的效应下,如果百度智能云无法获得拓展更大市场,未来可能面临地盘被吃掉的局面。这一次大模型带来的产业新范式,则让百度智能云看到了翻盘的可能。显然,百度是想借助借助文心大模型,取得更大市场优势,缩小与头部厂商的差距。

  但对于文心一言未来的应用前景,刘嘉伟表示目前看不会超越ChatGPT,它并没有给出新的想象空间。从这个角度看,或许也是今日百度股价大跌更为深层次的原因。

  目前,国内不少企业都在自研的类似模型,包括阿里、腾讯、字节、京东、科大讯飞、网易和360等。百度打响国内第一枪,虽然具体效果还有待验证,但也开启了以大模型为核心的技术产品市场竞争的新赛道。

  责任编辑:


您可能还会对下面的文章感兴趣:

登录 注册 退出