ChatGPT下半场:AI投资有戏吗?|AI|人工智能
随着大量的数据训练与模型的不断优化,AI技术离那个指数级增长的“技术爆炸”临界点越来越近。
作者丨陈伊荻、胡韵
近期,ChatGPT及AIGC(人工智能生成内容)相关概念火爆全网。街头巷尾都在热议这一新兴产品,“ChatGPT会抢谁饭碗”“美国89%大学生让ChatGPT代写作业”等话题赚足了眼球。
大众对AI(人工智能)的概念并不陌生。1997年,IBM超级电脑“深蓝”击败了国际象棋等级分排名世界第一的加里·卡斯帕罗夫,震动世界;但由于算力与数据不足,发展遇到瓶颈,政府AI投入经费开始下降,人工智能陷入低谷。2006年以后,以深度学习为代表的训练方法的成熟,推动AI迎来新的发展浪潮。2017年,AlphaGo在围棋赛中打败世界名将李世石,打开了AI大规模应用的大门。在此之后的几年内,不断有AI公司上市,AI技术也不断地拓展着新行业、新应用。
直到ChatGPT一夜之间突然爆火,我们忽然发现,AI技术已经发展到能够影响日常生活的程度,大众的思维也从“AI能做什么”进阶至“AI能为我做什么”,AI工具从此“飞入寻常百姓家”。
那么,ChatGPT背后的AIGC技术到底是什么?它会带来怎样的产业影响?AI技术会重新归于沉寂、等待下一次浪潮,还是就此一飞冲天?未来的AI行业还有哪些投资机会?本文将带领各位读者一探究竟。
-01?-
AIGC是AI技术的未来吗?
无论是ChatGPT这样的AI聊天,还是曾风靡一时的AI作画,都可以统称为AIGC(AI Generative Content),即利用人工智能技术来生成内容。相较于此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容),代表人工智能构思内容的AIGC,是Web3.0时代新一轮内容生产方式变革,将对整个AI领域产生重大影响。
在过往的AI技术应用中,我们通常将AI分为两类:分析式AI与决策式AI。分析式AI主要是自环境中获取信息、分析以后得出结果,这其中以计算机视觉、语音识别技术为典型代表。决策式AI在获取来自环境的信息以后,与信息产生动态交互,根据外界反馈调整模型参数,从而不断实现优化。使用者基于成熟的数据积累,不断训练AI模型,通过大数据挖掘出规律,从而做出决策。
AIGC所代表的生成式AI,起源于分析式AI。分析式AI在发展过程中诞生了卷积神经网络、残差深度网络、Transformer网络结构等技术,为生成式AI的产生奠定了基础。分析式AI学习的知识局限于数据本身,但生成式AI在总结归纳数据知识的基础上可以生成数据中不存在的样本。总的来说,AIGC是在分析式AI的技术基础上,学习数据产生模式,实现新样本内容的创造。
AIGC是AI技术发展的新机遇,广义的AIGC可以看作是像人类一样具备生成创造能力的生成式AI技术。它可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频、3D交互内容(如虚拟化身、虚拟物品、虚拟环境)等各种形式的内容和数据,以及包括开启科学新发现、创造新的价值和意义等。
业内普遍认为,AIGC将推动人工智能迎来下一个时代。Gartner将生成式AI列为2022年5大影响力技术之一。MIT科技评论也将AI合成数据列为2022年十大突破性技术之一,甚至将生成式Al称为是AI领域过去十年最具前景的进展。未来,兼具大模型和多模态模型的AIGC模型有望成为新的技术平台。Gartner预测,到2025年,生成式AI将占到所有生成数据的10%(目前这个比例还不足1%),根据其发布的2022年人工智能技术成熟度曲线,预计生成式AI在2-5内将进入生产成熟期,发展潜力与应用空间巨大。
随着AI技术的迭代发展,AIGC在变革内容产业的同时,将与搜索、办公、教育、金融、医疗、工业、影视、游戏等行业结合,进一步拓宽AI应用场景,加速AI商业落地。
但是,我们认为,AIGC不会是未来AI技术应用的全部。尽管ChatGPT在回答问题的完整性和逻辑性上有让人惊艳的表现,但是AIGC技术仍有一定的局限性。其中非常明显的内生局限在于,参与训练过程的标注人员和研究人员可能并不能完全代表语言模型的所有潜在最终用户,他们的排序主观偏好以及标注和设计的偏差会影响模型的数据。除此之外,AIGC技术的局限性还包括:训练成本与调用成本极高;回答缺乏引申能力、准确性与可控性;无法在线纳入新知识等等。另一方面,AIGC无法避免学习到存有偏见或不道德的答案,也无法明确用户使用目的,人工智能安全和伦理性问题依然存在。
-02?-
?决策式AI潜力不可小觑
决策式AI自2016年以来蓬勃发展,在平台推荐、内容审核、自动驾驶、企业数字化等领域都有着长足的发展,为现代社会的数字化转型做出了显著的贡献。
决策AI最先在内容推荐上落地,百度、字节等巨头借力于强化学习算法实现精准营销功能,优化用户使用体验,增加广告收入;亚马逊、淘宝等巨头借助个性化推荐算法,深度挖掘用户与物品的关联关系,将商品精准推送给用户;抖音、快手等平台的推荐算法通过对用户观看、停留、点赞等行为的实时分析,精准刻画用户画像,将用户可能感兴趣的内容推荐给用户,降低人工运营规则的摄入,显著提高了用户粘性。
此外,决策式AI通过规则引擎、文本分类、图像分类等进行内容审核,广泛应用于搜索引擎、社交平台、电子商务、新闻网站等领域,以确保内容符合法律法规和公司政策,保护用户隐私和安全,大幅降低了各公司人工审核的成本,提高了内容质量,建立了用户信任。
在自动驾驶领域,借助决策式AI,自动驾驶汽车可分析判别各种路况,并可对多种物体进行识别与跟踪,从而提高行车的安全性,例如行人、空旷行驶空间、地上标注、红绿灯、车辆等。目前自动驾驶市场规模快速增长,据Research&Markets,2021年全球无人驾驶汽车的市场规模约为273亿美元,2026年全球无人驾驶汽车市场规模将达到594亿美元,年复合增长率为16.84%。
在企业数字化领域,决策式AI能将互联网巨头的决策AI算法迁移至银行、零售、能源等结构化数据较为完备的传统行业。传统企业通常以人为核心进行决策,面临运营预测精度低导致的呆滞库存、营销不够精准导致转化率低等痛点。决策AI能够基于大数据,以实时技术支持智能排产、智能补货、智能配送等系统闭环,通过算法的增量学习不断改进性能,提升精度和优化运营决策效率。
随着自动机器学习(AutoML)技术诞生,企业进入基于机器的人工智能阶段,涉及的维度和效果进一步提升,但技术门槛大幅降低,大部分传统企业在数字化转型中“用得起”AI。AutoML技术框架中包含多项子框架:自动特征处理、自动算法选择和匹配、自动传统机器学习、自动深度学习等。使用AutoML之前,传统企业引入AI能力需要3-6个月,AutoML可以将该过程缩短至几小时。AutoML作为思想贯穿在多类机器学习过程中,降低AI在企业落地的门槛。
我们认为,AI在可预见的未来依然会多点开花。生成式AI与决策式AI的技术将会相互融合、互相促进。
-03?-
AI行业的科技投资机会
近年国内AI应用场景不断深化,研究实力也进一步增强。政策方面,国家出台一系列支持行业发展的政策,其中《十四五规划》提出要瞄准人工智能等前沿领域,聚焦人工智能关键算法,壮大人工智能产业。据工信部,截至目前,我国AI核心产业规模超过2000亿元,企业数量接近4000家,带动相关产业规模近数万亿元,并将持续快速增加。据艾瑞咨询预测,到2026年,我国人工智能核心产业规模有望达到6050亿元,20-26年复合增速为25.01%;并由此带动的相关产业规模将超过2万亿元。
数据、算法和算力是支撑人工智能发展的三大要素。ChatGPT的背后离不开于GPT大模型,而GPT大模型则需要依靠微软Azure超算中心提供算力训练。AIGC的产业链如下图,实际上,这样包括“数据、算法、算力”的产业链结构几乎适用于各类AI技术。
全球范围内AIGC独角兽已初步具备B+C端的变现能力,但海外公司明显领先于国内。AIGC应用层可分为图像、文本、视频、音频,海外AIGC企业如Jasper、Grammarly等已经积累大批用户群体,年收入超千万美元;大部分企业都至少启动了A轮融资,融资金额相对较大。而国内相关技术企业进展较慢,参与方以应用层为主。要提高国内AIGC独角兽发展速度,必须加快基础层建设,提高核心竞争力,同时找到更好的商业模式并具备变现能力。
从产业链情况来看,随着AI技术的发展,在信息技术领域,受益的投资方向主要分为以下几类:
提供算力支撑的基础设施领域:芯片、光模块、数据中心等。
GPU、CPU:AI模型的训练需要调用大量参数,需要大量算力。算力的支撑是AI技术发展的关键所在。GPU芯片由于具备并行计算能力,可兼容训练和推理,目前在AI训练中得到广泛应用。据称,ChatGPT训练模型中就已导入至少1万颗英伟达GPU,推理部分使用微软Azure云服务也需要大量GPU进行运作。
AI芯片:除了在传统的GPU、CPU芯片上增加AI算法外,也可以使用专用的AI芯片,例如Google的TPU、地平线的BPU、华为海思/紫光展锐的NPU芯片等。
Chiplet技术:市场对AI芯片在训练和推理等环节支撑大量数据高效处理提出了新的挑战 ,Chiplet(芯粒)是一项芯片级形式的复用技术,可以平衡大芯片的算力需求与成本。通过该技术,不同功能的IP,如CPU、存储器、模拟接口等,可灵活选择不同的工艺分别进行生产后集成在一起,最优配置功能模块并且不必受限于晶圆厂工艺,实现计算性能与成本的灵活平衡。
光模块与硅光技术:AI模型的大规模训练无法通过单一个人终端完成,需要大型数据中心的参与。伴随着数据传输量的增长,光模块作为数据中心内设备互联的载体,需求量随之增长。硅光芯片是采用硅光子技术制备的光芯片,利用成熟的CMOS微电子制备工艺,在同一硅晶圆上集成光源、调制器、波导、探测器、滤波器、CMOS电路等器件,实现光信号处理与电信号处理的深度融合。有望承载数据中心内主要的高速信息传输。
国内的代表厂家包括:海光信息、景嘉微(GPU芯片)、地平线(AI芯片)、中继旭创(光模块)、浪潮信息、宝信软件(数据中心)等。
具备数据收集处理与自研算法能力的AI公司:
AI算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势。算法上,数据标注属于AIGC算法的生成关键步骤,而在自然语言处理、机器视觉等方面,AIGC已经对此方向应用产生深远影响,例如已经实现的虚拟人与自然人的对话、AI作图、AI底层建模,随着技术的进一步成熟,势必对该方向应用产生革命性影响。
国内的代表厂家包括:第四范式、云从科技、科大讯飞、汉王科技、拓尔思等。
谷歌技术总监、《奇点临近》作者Ray Kurzweil曾经写道:“由于技术发展呈现指数式的增长,到2029年,机器将达到人类的智能水平;到2045年,人与机器将深度融合,那将标志着奇点时刻的到来。”
在过去几年内,AI技术发展的速度超越了大家的想象,尽管目前仍然还有局限性,但随着大量的数据训练与模型的不断优化,我们相信AI技术离那个指数级增长的“技术爆炸”临界点越来越近,届时,也将会给这个世界带来翻天覆地的变化。
本文为作者独立观点,不代表铅笔道立场,亦不构成投资建议。
特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。