GPT-4来了,国内AI企业如何接招? 专家:要“结硬寨”,别盲目对标
来源:封面新闻
封面新闻记者 欧阳宏宇
这几天,全球目光都集中在人工智能领域。国内,百度“文心一言”正式上线,目前国内已有多家公司宣布接入;海外,OpenAI在一天前发布了GPT3.0的“继任者”GPT-4,并在官方博文中表示,“这是深度学习的最新里程碑,在各种专业和学术基准上表现出人类水平。”
根据公开资料,GPT-4在基本智能水平和多模态模型方面得到了提升和优化,其参数达到百万亿级别,是GPT3.0的10倍,而且上能考托福,下能玩梗图。一个直观的例子是,GPT3.0在律师资格考试中排名在倒数10%,而GPT-4则能够战胜90%的人类。
OpenAI到底领先全球的同行几个身位?诸如百度、科大讯飞、汉王科技等中国大模型生成式AI企业怎么办?这样一款人工智能技术产品出现后,会对行业产生怎样的影响?3月16日,浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员盘和林表示,科技的道路,弯道超车的机会有,但不多;所以国内AI企业应该重视积累,包括参数积累、数据训练积累以及算力积累。“大多数科技领域开展的是阵地战,要尝试“结硬寨,打呆仗”的做法,夯实中国生成式AI发展的基础,推出成熟度较高的产品。”
OpenAI仍有所保留
识图能力应用前景广阔
据了解,目前GPT-4并没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。可即便如此,付款订阅渠道一度被挤爆。
之前上市的ChatGPT实质上等同于GPT3.5,未来,GPT-4的功能将以plus订阅的方式开展。新版本激发了用户热情,但在盘和林看来,OpenAI在技术上仍有保留。
盘和林认为,一方面是ChatGPT在去年底推出的时候本身是旧版本,很多用户测试时已发现ChatGPT无法回答2021年以后的问题,原因是ChatGPT在2021年迭代到了GPT3.0,而ChatGPT只是在GPT3.0的基础上略作优化的GPT3.5版本;而2021年以后的新数据都被用来训练GPT-4,这就导致ChatGPT无法覆盖这部分新知识。根据时间推算,GPT-4其实在2022年年中就基本完成,足见ChatGPT的发布是一个保守做法。
另一方面是GPT-4也是有保留的,原因是OpenAI有另一个热点AI产品——DELL-E2。根据公开资料,DELL-E2的功能是根据用户输入的一段文字生成一张图片;而GPT-4的功能是,根据用户输入一张图片,生成一段文字答案。
“如果两项AI功能结合,GPT将同时获得图片理解能力和图片表达能力。”盘和林认为,NLP自然语言处理只是OpenAI在人工智能领域的一块业务,未来整合旗下多个AI后,功能内容还将进一步丰富。
当前GPT-4的识图能力应用前景已非常广阔,比如,医学影像资料本身是图片,未来任何人都可以通过ChatGPT来实现医学影像自检。
“当然,这只是其中一项可能性。”盘和林预测,在很多行业领域,看懂图片是需要专业能力的,而GPT-4降低了这种识图门槛,比如医学影像、设计图纸、数学模型等,让普通人能够通过AI辅助介入到专业领域当中,所以GPT-4未来很可能成长为生产力工具。
国内企业可另辟蹊径
应要走技术积累之路
在ChatGPT出现时,不少国内的人工智能领域从业者还认为,中国的大模型生成式AI企业与OpenAI不存在技术壁垒,仅存在“时间壁垒”。
天眼查数据显示,截至目前,国内人工智能相关企业258.8万余家,其中,2022年新增注册企业73.2万余家,新增注册企业增速41.5%;近三年的人工智能相关企业新增注册增速均超过40%。GPT-4的出现后,这些企业又该怎么应对?
首先,国内生成式AI企业要走积累的路子。据估算,生成式AI需要持续大规模算力投入,以微软为例,其对GPT提供超过3万张A100芯片的算力支持,一张芯片价格要20多万元人民币,同时算力训练每次都要消耗大量能源。而且GPT-4百万亿的参数需要投入大量人力财力来完成积累,在数据方面投入的价值也很高。
“GPT从一开始就重视高质量数据,而高质量数据是GPT领先于其他生成式AI的核心竞争力,而数据质量提升是需要钱的。”盘和林指出,从算力、数据、算法调参这三个方面看,OpenAI前期烧钱的规模是海量的,而GPT-4也是一步步技术积累的最终结果,对于国内生成式AI企业来说,所谓“台上一分钟,台下十年功”一点也不夸张。
其次,国内生成式AI企业要在基础科学上做积累。“大模型算法的道理并不复杂,复杂的是算法细节。”盘和林认为,被微软收购后,OpenAI的算法已不可能开源,所以“等、靠、要”的做法已经行不通,国内AI企业要在算法技术上投入研发,构建中国AI企业自身的算法能力,然而算法的精益也要依靠基础科学的进步,比如基础数学研究。“比如要积极在学术上加强投入,而不应该仅仅聚焦在应用科学层面。”
再者,国内生成式AI企业不要盲目地推出对标产品。盘和林提醒到,前车之鉴就是谷歌,在OpenAI推出产品后,谷歌匆忙应战,结果发布会的若干个小瑕疵导致谷歌股价暴跌。
盘和林说,国内生成式AI企业要清楚认识到,ChatGPT的成功和过去其他概念有所不同。成功的基础在于用户的认可,即用户是会拿着ChatGPT和其他竞品做比较,这就让后来者更难做。“如果在生成式AI技术方面没有达到ChatGPT的水平,反而会暴露能力上的短板;反过来说,国内生成式AI企业也可以另辟蹊径,GPT-4并不是万能的,在其短板领域完全可有一番作为。”