声网首席科学家钟声谈ChatGPT大模型,创业者更应该关注什么?
近几个月来,ChatGPT以迅雷不及掩耳之势的节奏快速拉近了全人类对AI人工智能的认知,无数创业者纷纷入局。基于语言大模型的创业,有机会,更有挑战。如果真正想在这一领域有所造诣,就不能一昧的盲从或片面的认知现有技术。
在声网举办的RTE Insight 私享会上,声网首席科学家钟声为大家分享了ChatGPT大模型带来的机会与挑战。
钟声指出,ChatGPT的出现,微软或许早有“准备”。现在,AI智能全部由微软提供,ChatGPT已经被微软接入到了各个业务线里,从Bing搜索到Office ,再从运营支撑系统和业务支撑系统的维度来看,ChatGPT是一个“Game Changer”,对客服、搜索、助手都是有明显帮助的。
回顾一下ChatGPT的发展历程。2017年,Google做了 Transformer;2018年,OpenAI用Transformer做了GPT-1,参数量0.117B;2019年做了GPT-2,参数量1.5B;2020年GPT-3的参数量是175B;到2022年,ChatGPT出来了;2023年,GPT-4又来了。可怕的是,自去年11月ChatGPT发布以来,短短几个月的时间就有好几亿人天天在上面花很多时间。
面对发展如此迅速的ChatGPT,我们该如何乘借东风?钟声指出:“过去,算法一直在进步,有些公司在其中受益了,比如抖音就是靠算法推荐受益的。下一阶段,能做些什么事让我们每个人也受益?
先说语言大模型发展存在的问题:
1、计算需求增长过快。2年前的大语言模型就已经到了GPT-3,当时一个先进的语言模型需要大约5000张GPU来训练,现在往往要1万张GPU A100。而且GPU A100限制进口中国,目前大模型已经突破1万亿参数量了,对算力的要求在指数型增长。
2、算力受能源供给力限制。到2030年左右,算力可能就增长不动了,因为再增长会赔很多钱。今年核聚变有个突破,人类首次用核聚变产生了输出能力高于输入的能量,但它的商用至少还需要一二十年。
再说创业者应该关注什么:
1、性能云计算、存储、智能芯?和?效AI算法。一是DSA(架构),领域相关的架构并且做存算一体,量子计算等。推理芯片需要降低成本,即便像现在的ChatGPT,它推理部分的成本仍然很高。二是DSA(算法),为领域定制,理论上要少4、5个数量级,才能长期维持下去。
2、ChatGPT的数理能力比较差。有人把ChatGPT和另外一个数理工具Wolfram/Alpha连在一起,让ChatGPT吸Wolfram的能力,以此提升在数理计算的精确度。举个例子,有一家公司上线了DocsGPT,它可以帮助医生做它最不想做的事,比如把账单送到保险公司、写病历等。另外,Meta此前发布的LLaMA大模型没有OpenAI那么大,但它做了70亿、130亿、650亿的好几个模型,所以往这个领域深钻,让小模型小一点,再专注于自己的特长,并非一定要做像GPT-4这样全能、智能,通用的人工智能。
3、大模型面临数据资源不够。再过几年,当可供AI高质量训练的数据不够时,它的进步就会很受限。现实生活中产生的UGC、AIoT、摄像头等各种各样的数据,基本能够用来完善或解决已知的问题,但未知的问题怎么办?这里最重要的还是看AI是否能够自己产生数据。
4、核心技术。和Web3.0的思路一样,如果未来被几个少数的中心化AI控制,人类命运可能真的会被主宰了。所以,适当把智能分散,让智能泛在是很有必要的。此外,边端上的能力个性化、隐私也很重要。
此外,ChatGPT延时是有点大的,说明在边端上芯片的架构,类神经形态学、类脑计算仍然很重要。脑的工作机制和图灵机不一样,脑是通过一个神经信号、脉冲信号来激活神经元之间的连接,但计算机不是如此。边端跟领域相关的算法小很多,这样的算法是很值得追求的。总之,大脑现在有一个优势是能耗特别低,相当于20瓦的灯泡能想很多事。所以,能否做出耗电极低的AI芯片和算法是值得追求的方向。
5、智能泛在。如果大数据无处不在,用AI算法来学习大数据,然后泛化这个智能,只需一个索引就能把它检索出来,比如生成视频。
钟声表示,从2018年到现在,折腾了很久,无外乎是内容、消费者、交互方式。从内容和数据的角度,UGC越来越多;从消费方式的角度,变得越来越个性化了,不仅是算法推荐,而且还是非线性、突发性的消费,很多虚拟内容希望以一种实时临场的感觉进行交互,现在的交互方式,除了手以外,已经开始用语音、手势了。
我当时提了两点,一点是读我们大脑里想的东西,变成交互。内容多了以后,重点是在怎么找内容,就催生了算法推荐。知识很多,我们不知道如何获取,以及不知道哪些是有用的,所以需要自动提取。现在看得更清楚了,以后归于一统,全部由AI产生和支配,AI生成的视频可以让你一直看个不停。
不得不承认,对于创业者而言,一个新技术的出现,必然会带动无数的机会,但创业最重要的还是深度洞察,建立属于自己的技术或商业壁垒。
(推广)