百度文心一言登场,能成为“中国版ChatGPT”吗?
ChatGPT以火箭般的速度走红,吸引了无数人围观。互联网企业、科技巨头摩拳擦掌争先恐后,创业公司也不甘落后。《》
在外界的关注中,文心一言的发布会如期而至,商道童言(Innovationcase)也进行了深度关注。
而过去10年在AI领域研发费用投入超过1100亿元的百度,成为万众瞩目的对象,当ChatGPT席卷中国舆论场的时候,国人希望自己的人也能开发出类似的产品,百度基于大语言模型的生成式AI产品“文心一言”开启邀请测试。
?
百度的文心,中国的ChatGPT
在发布会之前,百度的文心就被外界定义为“中国版ChatGPT”。
发布会上,百度CEO李彦宏就提到,对于文心来说,大家的期待是对标ChatGPT,而发布是因为市场需求。未来已来,我们要逆水行舟,这是百度前的必答题。《》
一方面,能写论文、能写代码、能创作小说的ChatGPT,已经证明AI生成技术将重塑搜索版图,百度必须开辟新的竞争赛道;另一方面,中国需要有自己的大语言模型来未雨绸缪,防止“卡脖子”。百度深耕行业多年,使命必达,尽职尽责。
作为扎根本土市场的搜索巨头,百度在中文理解方面有着无可比拟的优势。在这个版本里面,文心一言拥有五大能力:文学创作、商业文案创作、数理逻辑计算、中文理解和多模态生成。
有幸获得内测资格的数字经济应用实践专家骆仁童表示,在测试过程中,文心一言在语义识别、生成质量方面与ChatGPT的差距还是很大的,但还是需要给百度更多的鼓励。
虽然还有待市场检验,但作为一款里程碑式的量产工具,文心一言的潜力可期。
?
发布会的演示,文心的能力
现场的内容创作演示中,文心一言不仅能准确理解人的意图,还能清晰地表达出来。据介绍,文心一言大模型训练数据包括网页数据、搜索数据和图片数据、以及语音通话、和知识图谱等。
文心一言还具有一定的思维能力,可以学习数学推导、逻辑推理等相对复杂的任务。 面对“鸡兔同笼”这种经典问题时,不仅识别出其中的逻辑思维,还识别出测试过程中出题留下的问题,并进行了反问,“题中有错吗?”在更新题目后,文心能理解题意并有正确的解题思路,然后按照正确的步骤一步步算出正确答案。
文学创作、商业文案、数学计算是大型语言模型的共同优势和能力。在此基础上,文心一言还展现了更好的中文理解和多模态生成能力。
由于有中文的大型语言模型,文心一言拥有中文领域最先进的自然语言处理能力,在中文语言和中国文化方面有着更出色的表现。在现场演示中,文心一言正确解释了成语“洛阳纸贵”的含义及相应的经济理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
洛阳城里春光好,
阳艳无双不负赏。
纸贵漫天诗词赋,
贵比黄金乐未央。
在多模态生成方面,文心一言展示了生成文字、图片、音频和视频的能力。有趣的是,文心一言甚至可以生成四川话等方言的语音。
这些应用发布后,有用户在百度文心一言发布会上重新向GPT4提问。
在文学内容的创作、洛阳知贵的解读、经济学原理等方面,两者不相上下。令人意外的是,在《三体》问题上,GPT4并未提供准确信息,将作者刘慈欣的家乡改成了湖南长沙;此外,GPT4 无法准确理解藏杂音的中文含义。
数字经济应用实践专家骆仁童对此表示,人工智能的核心在于大模型,大模型的基础在于数据,无论国内外哪家公司,都不可能在短时间内无中生有出完美的大模型,而且深度学习和自然语言处理也需要长年积累和打磨。
?
功能的局限,成长的可能
由于OpenAI的GPT4.0版本抢先发布,其中不乏惊艳的功能,导致反文心一言的发布会整体显得平淡,不少媒体评论带着唱衰、嘲讽的声音。资本市场也做出反应,百度港股一度跌近10%,不过在更多人内测文心一言后,市场对文心一言似乎有了改观。截至3月17日收盘,百度港股大涨13.67%
商道童言(Innovationcase)认为值得说明的是,百度是全球大厂中第一家推出对标ChatGPT产品的公司,而且这种创新与突破值得肯定。
文心一言背后的新一代知识增强大语言模型是在ERNIE和PLATO系列模型的基础上发展起来的。 文心大模型本身,是百度从2019年开始深度投入的预训练模型的研发。
具体来说,文心一言的关键技术包括有监督微调、人工反馈强化学习、提示、知识增强、检索增强和对话增强。再创新也是文心一言未来做强做大的基础。
超大规模模型的训练和推理给深度学习框架带来了巨大的挑战。例如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了4D混合并行技术。
对于未来的发展,数字经济应用实践专家骆仁童表示,文心一言是一种短语段内容生成的工具,有三个方面是发展的重点:
第一是要明确目标用户 :这个工具可能适用于广大互联网用户,尤其是那些喜欢在互联网上分享自己生活的人群。但也需要考虑到年龄和地区等因素,以便针对不同的用户进行优化。
第二是细化功能需求 :文心一言最主要的功能就是生成短内容,并且多样性很强,可以根据用户的喜好进行调整。但需要改进适用的场景,方便用户将生成的内容应用到自己的文案中。同时,为了保证用户体验,还需要提供反垃圾机制,避免出现低质量的内容。
最后是商业价值: 文心一言可以通过广告或合作伙伴方式获得收益,例如在短内容中添加广告或与相关品牌合作。
总之,从产品发展的角度来看,百度的文心一言是一个具有挑战性和潜力的项目。如果能够符合用户需求可行并产生商业价值,那么它将成为一个成功的产品。
?
行业的应用,颠覆的开端
人工智能的行业颠覆才刚刚开始,事实上,人工智能市场需求的爆发式增长将释放出前所未有的指数级商业价值。文心一言的现身,未来语言类的大模型会进一步带来三大产业的新机遇。
第一类是新型的云计算服务形态,从根本上改变云计算行业的行业模式。
过去,企业选择线上服务商的原因,更多是基于计算能力、存储等云基础服务。未来更多的还是要看框架好不好,模型好不好。
企业也可以基于人工智能的基础模块构建自己的模型和应用。农业、工业、金融、教育、医疗、交通、能源等重点领域效率将大幅提升,并在各行业快速形成新的产业空间,助力实现数字中国。
第二类是诞生新的商业服务,例如对行业模型进行微调、针对行业应用整合的公司。
这也是解决一般大型模型和企业之间的衔接需求。基于对行业的洞察,可以调用通用大模型的能力,为行业客户提供解决方案。
第三类是基于大模型库开发应用的服务,推进应用服务的成熟。
对于大多数企业家和企业来说,真正的机会不是从头开始构建ChatGPT、文心一言等基础模型,基于文字生成、图像生成、音频生成、视频生成、数字人、3D等场景,涌现出众多初创明星公司,它们可能是未来的新巨头。
正如李彦宏所说, “人工智能将彻底改变我们今天所拥有的每一个行业。人工智能的长期价值和对各行各业的颠覆性变革才刚刚开始,未来还会有更多的杀手级应用和现象级产品出现、 将会有更多的里程碑事件。”
商道童言(Innovationcases)欢迎点赞和分享哦!~~
免费电子书: | | | |
数字经济应用实践专家 骆仁童主讲课程
智慧应用 |《.......
数字应用 | ..
人工智能 | .
数字化转型 |.
金融类课程 | . .
思维与技能 |》..
宏观与趋势 |...
创新与创业 |.