Chat GPT4.0引爆热潮!
近段时间ChatGPT火爆全球,但其仍是GPT的3.5版本,据《财富》杂志报道,OpenAI还有更多创新蓄势待发,OpenAI在贝塔测试版GPT-4中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。此外,2月28日,百度 发布官方预告,计划于3月16日14时在北京总部召开新闻发布会,主题围绕ChatGPT项目“文心一言”,后期百度将开放“文心一言”大模型,支持更多企业构建自己的模型和应用。“中国版ChatGPT”给出了落地的时间,而A股向来是比较青睐有明确时间窗口的题材。
此外,昨日国盛证券发布名为“GPT4 展望:多模态,CHATGPT 下一站”的研报,其中提到:OpenAI在贝塔测试版GPT-4中采用了更强大的大语言模型,预计该版本将于今年甚至很快发布。
国盛证券称,若GPT4转向多模态,未来输入输出可能出现图像、视频等形态,有望打开下游千行百业应用空间
国盛证券表示,多模态,或许是CHATGPT的下一站。
所谓多模态模型,就是未来大模型的输入输出可以不仅限于文字,还可以包括图像、视频等多种形式。
国盛证券认为,若GPT4转向多模态,将大幅提升AI视觉方向生产效率,图像、视频等应用将层出不穷涌现。其使用场景将远远不仅限于文字、问答与办公,打开有望未来AI在下游千行百业的应用空间,进一步打开市场想象力。
实际上,OpenAI的绘画AI模型DALL-E2就是目前最知名的多模态模型之一。除此之外,其他知名多模态模型还包括在AIGC界引起过巨大反响的Stable Diffusion,以及谷歌推出的音乐生成AI模型MusicLM等。
1)DALL-E 2:OpenAI推出的AI绘画模型,在前代DALL-E的基础之上有了很大提升,可以直接根据文字生成图像,也可以输入图像后、子现成图像上根据文字指令进行部分修改,功能强大。
2)Stable diffusion:由ai公司在去年开源的AI绘画模型,可以通过输入文字生成对应图像。由于效果极佳,模型一经开源即在AIGC界引起极大反响。
国盛证券还提到,由于多模态模型使用图像、视频等多媒体数据进行训练,而此类文件大小远超文字,算力需求有望激增。
1)以Stable diffusion为例,根据公司官网信息披露,该模型训练数据集为LAION 5B的一个子数据集,而LAION 5B的数据包至少80TB,规模已经远超传统语言类大模型训练时使用的数据量(一般是GB级的)。
该模型使用4000块英伟达 A100训练了一个月,算力需求庞大。若按AWS官网上租用价格(32.77美元/小时/8 GPU)计算,则该模型训练成本可高达4000/8*32.77*24*30=1179.72万美元。
2)无独有偶,DALL-E2模型在训练时使用了5亿张图片,按单张图片大小512*512像素(约256kb)估算,整体训练数据集大小高达约155TB
GPT4.0概念股:
网达软件(603189 ):公司致力于视频智能化技术研发,将AIGC功能融入到视频生产发布平台业务中。
苏州科达(603660 ):公司推出的全景特写一体化VR球机、智慧路口等产品和解决方案均已实现落地应用。
当虹科技(688039 ):公司专注于智能视频技术的算法研究,拥有高质量视频编转码、智能人像识别、视频云服务等技术。
宣亚国际(300612 ):子公司云目未来是一家依托深度学与计算机视觉技术,用AI“理解”视频内容的科技公司。
贝仕达克(300822 ):公司联营企业的子公司自主研发设计的Al宠物短视频制造机等相关产品
信雅达(600571 ):公司旨在通过人工智能技术 ,辅助银行 、保险和证券等金融客户快速录入图片等非结构化信息中的文字/数字。
荣信文化(301231 ):公司推出了集合语音点读、A1智能诘音互动、本地语音录制等多项功能的乐乐趣小火箭AI智能点读笔。
数码视讯(300079 ):公司多年来积极研发AI技术,利用AI算法AIGC自动生产高清、超高清视频内容 。
大华股份(002236 ):公司以视频技术为基础,开发了机器视觉 ,视频会议系统,专业无人机 ,智慧消防和 机器人 等多个视频新业务。
云从科技 (688327):公司正在与第三方进行合作,其借助公司的能力,对海量的演讲视频内容进行提炼和再创作