Chat GPT的国产化之路,道阻且长!
开年以来,Chat GPT的各种新闻一直不绝于耳,相信大家对Chat GPT的各类介绍也已经司空见惯了,或者说见怪不怪了,为什么这么说呢?因为现在关于Chat GPT的各类文章和视频,真真假假,虚虚实实,连业内人员也未必分得清楚,哪些是真实的,哪些是虚构的。
不过话说回来,咱们有一说一,AIGC(人工智能生成内容)方向本来一直就是业内的热点研究方向,比如前些年的图像生成方向的style GAN系列,以及GPT模型的前几代,每次发布出来都会引起一阵骚动,但从未像Chat GPT发布后有如此的现象级热度,Chat GPT热到了什么程度呢?这么说吧,以前搞设计、搞建筑、搞物流的同学朋友在不久之前都曾向我问起过Chat GPT怎么玩?能不能给他一个账号?甚至于网上有各种账号贩卖,教他人注册账号的。
由此可见,Chat GPT的热度绝对不亚于当年的Alpha GO对战李世石的情景,但是Chat GPT对社会生产结构产生的冲击力却远远大于Alpha GO,如果说Alpha GO是从某一领域的思维或智力上超越了人类,那么Chat GPT则是从全领域无限的接近了人类,下棋对它来说简直是小菜一碟。网上有人和Chat GPT对战了,发现它不但会下棋,还会教你下棋,和它交流,还会说出它走每一步的意图。
当然这些可能都还对大家造不成实质性的伤害,比人类会下棋、比人类会玩游戏等,顶多是超越了人类在娱乐领域的技术,但是如果它对你当前的工作产生了一定的替代性呢?或者说直接替代了你的工作呢?这个时候它就不只是对你智商上的侮辱了,而是真真实实的对你的生存造成了伤害了,让大部分人失去工作也只是它的初步计划而已,因为在它的发展里程中,大部分人将会越来越无用,社会上将会产生大量的无用阶层。
国内国外现在已经有多家自媒体企业计划或者已经在使用Chat GPT技术来替代员工写稿了。当然,你可能会说,一个机器怎么会和人类一样有感情呢?它写出的文章肯定是很形式化的,没有任何感情色彩的,也不可能有打动人的地方,如果你这么想,那你就错了。
首先,Chat GPT的学习方式是使用了人类反馈强化学习方法——RLHF(Reinforcement Learning from Human Feedback),在模型训练的过程中,使用了强化学习模型来代替人类老师来监督它的学习,理论上来讲,只要它的训练素材使用了大量的某类文章素材,那么它在该领域的文章创作上,是处于中上游的。是的,你没有看错,虽然比不上顶级写手,但是它比一般的写手要强。
Chat GPT对于各行业都会产生一定的影响,当然最近的就是和语言文字输出有关的行业和职业了,接下来还会延申到图像、视频、音乐、语音等领域。毫无疑问,Chat GPT从真正意义上打响了人类走向AGI(通用人工智能,强人工智能)的第一枪。顺便提一下,网上有人已经使用Chat GPT创作了音乐,听起来调子还不错。
当然,Chat GPT也有其缺陷,最常被诟病的就是大家常说的“一本正经的胡说八道”,这是因为Chat GPT它的训练目标是为了让它更像一个人类,而非机器,所以他会说谎,或者“开玩笑”,还有一个重要的原因是因为它的训练素材中没有包括你想要问的东西的时候,它也有可能会编造出一个看似合理,但是并不存在的答案。这对于懂行的人没有太大问题,但是对于外行人可能会造成误导,可能会影响对于一些事物的理解。
Chat GPT其实是Open AI发布的一个GPT3和GPT4之间的过渡版本,也就是GPT3.5,本来也只是测试一下,但是没有想到,市场的反应会如此剧烈。据说Open AI会在2023年的春夏季发布GPT4,届时,当前Chat GPT存在的一些问题,可能都会得到解决。
说了这么多,有很多国人还没有体验过Chat GPT的使用,国内众多厂家,都豪言已经具备了Chat GPT的相关技术,随时就可以整出一个来,可是自从他们发言到现在,时间也快一个月了,有的说是在测试,但连一个测试码在哪里申请也不说,有的就更不够意思了,拍完胸膛后,连是否测试都不说了。
说这话并不是指责,毕竟科学技术的东西容不得包装和粉饰。当然也有可能是我错怪了,希望明天睡醒就能用上国产的Chat GPT,不用爬墙、不用搭梯子,也不要购买虚拟电话号码了。可是理性地思考一番,很多事情确实不是我们往希望的方向去想就能实现的。或许在国内,出现一个Chat GPT真的太难了,或许这不止关乎于技术的问题,可能还会涉及到很多敏感性的问题,不然大家不用搭梯子,也能浏览外面的世界了!
我相信纵然有万般羁绊,国内的互联网大企业还是一定铆足了劲儿的在研发各家的Chat GPT,大家都不想落在后面,从商业环境上来讲,Chat GPT这东西小企业在短期内研发不出来的,小企业一没资金,二缺人才,三少资源,只能跟着大公司喝口汤,做它的下游渠道商。
而互联网大企业不搞Chat GPT就要出局,这次互联网大企业自己不研发Chat GPT可不是位置落后的问题,是真的有可能会出局,国外的很多互联网大厂,包括谷歌、亚马逊、脸书等众多公司都在研发或者已经研发出来了自家的Chat GPT了,因为这是一场决定未来10-20年甚至更久远的霸主的机会,未来谁是主宰者,谁将影响科技的发展,都将和这次的决定息息相关。Chat GPT是否让人类产生了焦虑,这点目前无从考究,但是它已经让国际知名互联网企业集体产生了焦虑。
试想一下,如果十多年前大家都在争先恐后的布局移动互联网的时候,百度多少花点精力参加一下,如今在移动互联网的地位也是要比真实的高很多的。当然百度提前进入了人工智能的布局,也是国内少有的对人工智能进行长期布局的企业。在国内,无论是人工智能学习框架,还是自动驾驶,都有百度的paddlepaddle和Apollo。
当然这次的Chat GPT风波也少不了百度,据说百度的Chat GPT——文心一言已经在最后测试阶段了,3月16日就要和大家正式见面,说实话,我对百度的广告是深恶痛绝,但是在国内,对人工智能领域有贡献的企业当中,百度是为数不多的让我感到比较着调的,不像有的企业打着人工智能的名号搞房地产去了,大家还是耐心的静候国产Chat GPT吧!
就在各大巨头都在私底下埋头苦干的时候,前两天复旦大学不声不响的突然公布了自家的Chat GPT,名字叫MOSS,没错,这个名字是《流量地球》中的具有自我意识的人工智能量子计算机,不得不说,取个好名很重要。当然,复旦大学刚一发布出来,服务器就被挤爆了,测试码更是一码难求,与之对应的是各种群嘲,本来复旦大学发布这个MOSS也就是为做测试,所以出现各种问题是在所难免的。复旦MOSS团队也表示MOSS还是一个非常不成熟的模型,距离真正的Chat GPT还有很长的路需要走。
科学的发展是无止境的,有时候冒险一点何尝不是一件好事情呢,复旦大学不声不响的发布了一个不完美的MOSS,总比过一些每天喊话,吊着大家胃口的公司要来的更实在一些。说一千道一万,国内做不出Chat GPT,是有先天性问题的,那就是国内的AI技术发展起步晚。再加上各种政策环境因素的影响,以及国内普遍的学以致用的思维和商业应用为主的市场,导致研究底层基础性学科的人员寥寥无几。虽然国家也意识到了这点,提出了“强基计划”,但是成效不是短期就能够显现的,更何况市场还有一个变化期的。
现在开始研发Chat GPT的企业,大部分也都是从开源的GPT2模型的基础上开始的,或者基于其他复刻的GPT3和Chat GPT的开源版进行研究的,毕竟正版的GPT3和Chat GPT都没有开源,这也难怪让艾伦马斯克吐槽,说Open AI越来越不Open了,这也是他离开Open AI的原因,因为这有悖于他建立一个开放组织的理念,还说现在的Open AI已经完全沦为了微软的打手,忘记了初衷。
随着国际局势的风云变幻,有可能在未来的几年内,国外和国内在技术研究领域的切割将会愈加明显,说不定哪天github也不让你使用了,你熟悉的深度学习框架也不给你更新API了,到时候就只能离线玩玩,就像现在我们北边的邻居一样,所以我们急需建立和完善现有的技术框架,尤其是底层基础性的技术研究。Chat GPT的国产化之路只是AI技术发展中的冰山一角,缺少了美帝们的开源技术,我们未来的AI技术发展之路,道阻且长!