ChatGPT+Midjourney,一卷卫生纸拍出科幻大片!200万网友围观
AIGC时代来临,整个内容创造领域在都被颠覆!新机遇面前,谁会被替代,谁又能弯道超车?
编者按:本文来自微信公众号 新智元(ID:AI_era),作者:新智元,创业邦经授权发布。
最近,AI跑得实在太快!
国外大佬为一纸「AI不扩散条约」吵得不可开交。 国内这边,B站、爱奇艺等一众互联网企业也在成都视听大会上大讲特讲AIGC。其中,陈睿也在现场介绍了B站的AIGC内容。
陈睿提到,随着AIGC时代的来临,我们每个人都身处科学技术加速变革的新时代:
陈睿预言,AIGC时代的来临,并不只是一场科技领域的革新,而是对整个互联网行业,甚至对整个社会都有颠覆性的影响。
在ChatGPT等AI技术爆炸式增长的年代,陈睿的判断并非空穴来风。
前段时间凭借「一对坐在屋顶的90年代中国情侣」出圈的AI作画神器Midjourney,更是不要太火。
一大波新用户涌入之后,直接挤爆了服务器,导致官方被迫叫停免费试用。
与此同时,各种神乎其技的AI绘画层出不穷——
有穿越到苏联工厂的马斯克,有看海棠的学妹,还有中国版的赫本等等。
此处分享一个prompt,可以尝试尝试:
而且,如此震撼的V5才刚推出没多久,更厉害的V6、V7、V8据说已经在路上了。
在成都视听大会上,陈睿提到,AIGC的发展将极大地提高内容创作者的效率,就像2000年手机出现摄像头,让普通人也能随意拍摄一样,AIGC的出现也能让很多普通人,也能创作出过去只有专业人士才能创作的内容。
前段时间,一个外国小哥,就尝试了完全由AI主导,创作一条视频。这条视频从脚本,到导演、编剧、摄影、配乐的活,AI全包圆了。
而且这条视频,完全是用现在主流的AI工具做出来的,而这位小哥其实只是个AI的工具人(顺便出了个镜)。也就是说,我们现在就可以像他一样,完全操纵AI来创作视频了。
其中,脚本由ChatGPT编写,图像由Midjourney生成,然后使用Runway Gen-1,把图像风格应用到源视频中,最后,再由Boomy AI配乐。
首先,对ChatGPT说:「给我写一个脚本,生成一个由三个3秒剪辑组成的9秒视频。这个故事是,一个男人在他的客厅里,要以科幻为主题。」
ChatGPT生成了如下的脚本。
第二步,就可以根据脚本,在Midjourney中制作参考图像了。
在第三步,这位小哥重新布置了客厅里的一些家具,为了更好地匹配参考图像,来得到更清晰的输出。
然后,他用一部iPhone,就拍摄出了原始镜头。
第四步,他把视频和参考图像上传到Gen-1,它立马把视频变成了参考图像的风格。
这一步中,小哥没有使用文本提示,但添加了--interpolate 作为更平滑输出的参数。
第五步,就是把视频导入视频编辑器。
他用的是iMovie。导入视频后,修剪了一些片段,然后把它们连在一起。
第六步,小哥从Boomy中,根据自己想要的风格和情绪,生成了配乐。
他在选择了一首叫做「Trippy Harvester by Peaky Chicky」的曲子,与场景的气氛非常相配。
最后一步,添加音乐并导出。
非常幸运的是,不需要进行太多剪辑,因为视频和音乐完美地吻合。
就这样,经过了3个小时后,一段梦幻大片诞生了!
无独有偶,国内的B站UP主「Mega会玩」,也通过几个AI工具,让乔布斯「复活」了。
在参观了乔布斯故居之后,Mega忽然有了一个想法,希望生成一段自己采访乔布斯的视频。
乔布斯的「大脑」,当然就来自ChatGPT。因为已经用1750亿参数训练过,它完全可以以对应人物的风格进行对话。
而乔布斯的声音,则是用一款Tacotron 2模型生成的。
Mega把乔布斯生前的语音素材进行分段处理、标记,训练了几天后,最终生成了乔布斯的AI语音模型。
而接下来,便来到了最有趣的一步——用AI克隆一个人。
如果2023年,乔帮主依旧活着,应该是一位年近七旬的老人。
Mega使用Midjourney,调整了各种参数和prompt之后,终于生成了一个理想的最终版本。
在下面这个视频中,我们看到了「复活」的乔布斯对于自己的重生这样描述道:
而在采访最后,Mega问出了自己最想问的那个问题: 你对于现在的苹果公司有什么感想吗?
「乔布斯」的回答可谓亮点满满:「我无法评价苹果当前的文化和践行,因为我已经不是他的一部分。但我真心希望,苹果可以一直铭记创新和突破现状的重要性。」
除了可以凭空生出我们想要的内容外,AI还肩负着一项重要的「使命」:搞定制作过程中繁琐的「脏活累活」。
关于知名UP主半佛仙人,一直有着这样一个未解之谜:他的视频里,为什么能有这么多好笑的表情包?
瓜众们对这个问题实在太好奇了,以至于这个知乎问题已经有了43万的浏览量……
而在这个问题下,半佛仙人本人也出现了,解答了瓜众们的疑问——其实,这些素材就是用Python爬出来的……
另外半佛仙人表示,自己当然有团队,否则按这个产量,没有团队的话物理学都得被颠覆了。
那现在,有了AI工具,这些表情包甚至都不需要爬虫,可以自己量产了。
虽然目前,整合素材、寻找合适的音效和画面、加后期配音等过程都还需要人肉制作,但未来这些功能,很可能AI都能给我们包了。
比如最近,ChatGPT联网后,可以接入各种第三方插件了。
其中一个「代码解释器」插件,可以直接让我们用ChatGPT编辑视频了。
只要给出一个指令,ChatGPT就会对上传视频文件进行处理,稍等片刻之后,就可以直接下载了。没错,就是这么炸裂。
这么看来,未来在AI的加持下,人类创作者们可能真就只需要出个脑子,剩下那些不想做,或者麻烦的,都可以丢给AI去负责。
看到这里,或许会有人惊呼,既然知识供给模式被完全颠覆了,那知识创造者的饭碗,岂不是也被砸了?
其实,还没到这一步。
让AI成为自己手中趁手的利器,远比忧心自己被AI淘汰了来得实际。
要知道,现在的许多人还没有提出需求的能力,也根本想不清楚自己「需要什么」。
比如,给你一个AI画图工具,你能用它画出什么?
它的上限,完全取决于你prompt能力的上限。
AI的能力,已经给你放在这儿了,你能如何驾驭它,用它大力出奇迹,则完全取决于你的指挥能力。
比如现在,让你生成一幅港口的照片,你会怎样去对Midjourney和Stable Diffusion去描述?
一个真正的prompt大师,能写出「港口、船只、日落、美丽的光线、黄金时刻……超现实主义、聚焦的、细节丰富的……电影画质,杰作」这样的提示,让AI画出一幅完美的画作。
而最近小编印象深刻的一个例子是,在必应的Image Creator里,我想试试画出《荷马史诗》的场景。
然而要输入prompt时,却忽然词穷了。
小编灵机一动,那让GPT-4教教我?
把GPT-4给出的prompt,放进Image Creator后,生成的画真是震撼我全家……
而去年在科罗拉多州博览会艺术比赛的获奖者、《太空歌剧院》的创作者,直接拒绝分享出自己在Midjourney所用的提示。
据说,他花了80多个小时,在900次迭代中,才完成了这幅画作。
这也就是为什么,外国的prompt工程师,年薪已经开到了36万美元。
从AI作画来说,一个优秀的提示工程师,必须拥有多学科的背景。经验丰富的工程师,和业余爱好者之中,存在着明显的门槛。
只有掌握了丰富的艺术史和平面设计等专业知识,才能写出「用 35 毫米胶片拍摄」「波斯……伊斯法罕的建筑」「法国画家Henri de Toulouse-Lautrec的风格」这样专业级别的prompt,生成如下画作。
从这一点来说,人和人的差别,在AI面前将被无限放大。
很明显,你本身需要是一个知识广度和深度都足够的人,你有多渊博,AI就有多出彩。
当信息可以被极度自由地获取,对信息的再加工也就随之变得更重要,在这一点上,我们每个人都是站在同一起跑线上的。
可以想见,在这种情况下,知识付费会是移动互联网催生出来的一大商机。
就在这几个月,我们亲眼见证了种种AIGC产品的光速迭代,成为「知识中介」这件事,也变得前所未有的简单。
随着AIGC技术的发展,做视频可能难度并不会比写文章高多少。内容创作者只需要出核心的创意,剩下的都可以交给AI来自动生成,视频制作的难度将会大幅度降低。
个人创作者的数量,可能也会迎来高速增长。
尤其利好的,可能就是B站知识类UP主这类创作者。毕竟剪视频的时间省了,找资料的时间也省了。只要有核心的创意点,做出优质视频就不是问题。
届时,优质创作者的内容创意潜力将被完全开发出来,视频将会成为绝对主流的内容。
对于创作者来说,这并不是某种遥不可及的预言,而是触手可及的近未来。
这也是为什么,B站上最近这几个月ChatGPT相关内容井喷,更是有很多UP主直接开始尝试用AI做视频。
也许不用多久,我们就能看到,越来越多独立创作者出现。他们不用再选择团队创作这种重工业模式,而是一两个主创+AI就可以轻装上阵,用比过往高十倍二十倍的效率创作,将那些本来没有能力做成视频的内容,畅快表达出来。
可以想象,随着AIGC的繁荣,知识类视频平台的发展,都会迎来一波水涨船高。
那么,在不久的将来,谁将被AI取代,而谁又会弯道超车?
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。