抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云

2023-02-19

　　机器之心报道

　　机器之心编辑部

　　不是跟不跟的问题，而是要怎么跟。

　　ChatGPT 引发了全球科技巨头的军备竞赛，在国内，一场竞争也在逐渐燃起，有跟进研究同型产品的公司，有从零开始建「OpenAI」的投资人，也有一系列相关项目。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图1)

　　近日，美团联合创始人王慧文在朋友圈高调发声，表示愿意带资 5000 万美元（约合人民币 3.4 亿元）入组并进军人工智能，以打造中国版 OpenAI 和 ChatGPT。

　　与此同时，国内也开始支持 ChatGPT 类大模型的研究。

　　昨日，在北京举行的北京人工智能产业创新发展大会上，北京市经济和信息化局正式发布了《2022 年北京人工智能产业发展白皮书》。白皮书显示，截至 2022 年 10 月，北京拥有人工智能核心企业 1048 家，占我国人工智能核心企业总量的 29%。

　　白皮书还提到，今年北京市将引导企业、高校、科研院所、新型研发机构、开源社区等，围绕人工智能关键核心技术创新协同攻关，持续推动建设具有全球影响力的人工智能创新策源地。同时，支持头部企业打造对标 ChatGPT 的大模型，构建开源框架和通用大模型的应用生态，形成人工智能产业发展新突破。

　　ChatGPT 是多项 AI 技术的集大成者，背后离不开庞大的算力、人才等资源的支持。因此，国内各大科技公司自然被寄予厚望。这些公司最近也纷纷做出了表态。在这篇文章中，机器之心通过向企业求证、根据网络公开信息整理，为大家梳理了一下各大公司的回应以及这些公司现有的技术储备，希望为大家提供一些参考。

　　百度：「文心一言」3 月见

　　在国内众多科技大厂中，百度是最早针对 ChatGPT 做出明确表态的公司之一。2 月 7 日，百度正式官宣将在 3 月上线百度版 ChatGPT——「文心一言」（英文名为 ERNIE Bot）。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图2)

　　随后，网上便出现了很多以「文心一言」命名的社交账号。百度方面表示，这些账号都不是真的，「文心一言」目前还处于上线前的冲刺阶段，3 月将和大家正式见面。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图3)

　　针对 ChatGPT 背后的技术，百度也给出了回应，称「ChatGPT 相关技术，百度都有。」「百度在人工智能四层架构中有全栈布局，包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用。」而文心一言位于模型层。

　　这个模型层的产业级知识增强「文心」系列大模型已经布局多年，具备跨模态、跨语言的深度语义理解与生成能力。2019 年开始，百度深耕预训练模型研发，先后发布知识增强文心（ERNIE）系列模型。文心系列模型基于持续学习的语义理解框架，从大规模知识和海量数据中融合学习，效率更高，效果更好。2021 年 12 月，ERNIE 3.0 升级为全球首个知识增强千亿大模型鹏城 - 百度?文心，同时，产业级知识增强大模型文心全景图亮相。文心大模型在历次升级中持续加强知识增强，使之成为与产业级并列的两大核心特色之一。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图4)

　　百度的文心大模型全景图。

　　知情人士透露，百度搜索早就接入了文心相关技术，「文心一言」的推出或将对百度搜索的升级起到重大作用。前段时间，百度 CEO 李彦宏将 2023 年一季度 OKR 关键任务定为「引领搜索体验的代际变革」。同时，李彦宏提到，ChatGPT 相关技术已达到临界点，百度在其中有较大的机会。

　　「这很宏伟，很激动人心。但我们认为它是可实现的，因为技术已经到了临界点。类似 ChatGPT 这样的技术很火，如何用在搜索场景上，这是比技术本身更难探索的。怎么能把这件事情做出来，让每天有几亿人从中受益，让他们的效率有明显的提升？未来一年，在这方面我们非常有机会。」李彦宏称。

　　「此次文心一言落地，首站将直接接入百度搜索。」知情人士透露，「一些相关功能已陆续在百度搜索内上线或内测，包括多答案回复、智能生成等」。

　　华为：在大模型领域早有布局

　　和百度不同，华为这一轮的回应并没有透露对标 ChatGPT 的具体计划，而是对自家在大模型方面的投入进行了简短回顾。

　　华为计算产品线相关负责人表示，公司 2020 年在大模型领域开始有布局，2021 年基于昇腾 AI 与鹏城实验室联合发布了鹏程。盘古大模型，是业界首个千亿级生成和理解中文 NLP 大模型。在模型性能方面，当时的鹏程。盘古大模型性能全球领先，16 个下游任务中性能指标优于业界 SOTA 模型。在应用方面，鹏程。盘古支持丰富的应用场景，在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图5)

　　该负责人还表示，在大模型产业化方面，华为已发起了智能遥感开源生态联合体、多模态人工智能产业联合体、智能流体力学产业联合体等。华为将以联合体的模式把科研院所、产业厂商等结合起来，更好地让大模型产业形成正向的闭环回路。

　　这些联合体由国内多个学界、业界机构组成，他们围绕自身与华为构建的一些基础设施展开大模型研究。比如：

　　中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东。太初，通过跨模态语义关联达成了视觉 - 文本 - 语音三模态的统一表达和高效协同；鹏城实验室基于昇思 MindSpore AI 框架打造了面向生物医学领域的 AI 平台 —— 鹏程。神农，包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块，深度赋能生物制药；武汉大学利用武汉人工智能计算中心 AI 集群推出了武汉.LuoJia，包含全球首个遥感影像智能解译专用框架武汉.LuoJiaNET 和业界最大遥感影像样本数据集武汉.LuoJiaSET，并已于今年 6 月分别上线昇腾和昇思社区；

　　……

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图6)

　　在华为伙伴暨开发者大会 2022 上，华为发布了其昇腾大模型沙盘规划，明确了基础大模型和行业大模型 / 应用并行发展的整体布局。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图7)

　　腾讯：在相关方向上已有布局

　　腾讯对 ChatGPT 的回应发布于 2 月 9 日。该公司表示：「目前，腾讯在相关方向上已有布局，专项研究也在有序推进。腾讯持续投入 AI 等前沿技术的研发，基于此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备，将进一步开展前沿研究及应用探索。」

　　相关技术储备包括「混元」系列 AI 大模型、智能创作助手文涌（Effidit）等。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图8)

　　其中，混元 AI 大模型完整覆盖 NLP（自然语言处理）、CV（计算机视觉）、多模态等基础模型和众多行业 / 领域模型。「文涌」的实现融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术，具有智能纠错、文本补全、文本润色等功能，部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型。

　　去年，混元 AI 大模型团队推出了万亿级别中文 NLP 预训练模型 HunYuan-NLP-1T，该模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。随着 AIGC 兴起，未来混元 AI 大模型会不断推进在文本内容生成、文生图等领域的持续升级。

　　字节跳动：当前不做过多回应

　　2 月 9 日，有传闻称，字节跳动的人工智能实验室（AI Lab 有开展类似 ChatGPT 和 AIGC 的相关研发，未来或为旗下 PICO 提供技术支持。

　　但随后，PICO 相关负责人否认了传闻，说消息不实，PICO 目前没有采用类似 ChatGPT 技术的产品规划。

　　机器之心就相关问题询问字节跳动，字节表示当前不做过多回应。

　　在 AIGC 方向，字节跳动的研究成果包括非自回归模型 DA-Transformer、端到端语音到文本翻译模型 ConST、多颗粒度的视觉语言模型 X-VLM、图片和文本统一生成模型 DaVinci 等。其中 DA-Transformer 在机器翻译上首次达到了 Transformer 同样的精度，而处理的速度提高了 7~14 倍。DA-Transformer 不仅可以用于机器翻译，而且可以用于任意的序列到序列任务。

　　阿里巴巴：确实在研发中

　　关于阿里巴巴入局 ChatGPT 的传闻始于一张截图。该图显示，阿里巴巴可能将 AI 大模型技术与钉钉生产力工具深度结合。对此，阿里巴巴称，「确实在研发中，目前处于内测阶段，后续如有更多信息，会第一时间和大众同步。」

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图9)

　　这一展示是阿里巴巴过去几年在大模型领域持续布局的成果。

　　2021 年初，阿里巴巴达摩院提出了百亿参数的超大规模中文多模态预训练模型 M6，并持续推出多个版本，参数逐步从百亿规模扩展到十万亿规模，在大模型、绿色 / 低碳 AI、AI 商业化、服务化等诸多方面取得突破性进展。

　　2022 年，在探索算力极限的同时，他们也积极展开了针对通用模型的探索，提出业界首个通用的统一大模型（模态、任务和架构）M6-OFA，极大地降低了模型在预训练、适配下游任务、推理过程中的难度。这个大模型是达摩院公布的阿里巴巴「通义」大模型系列的一部分。该系列分为三个层级：最底层为统一模型底座，中间基于底座的通用模型层覆盖了通义 - M6、通义 - AliceMind 和通义 - 视觉，专业模型层深入电商、医疗、娱乐、设计、金融等行业。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图10)

　　京东云：将推出「产业版」ChatGPT

　　2 月 10 日，京东云通过官方公众号发布了将推出「产业版」ChatGPT——ChatJD 的消息，同时公布了 ChatJD 的落地应用路线图「125」计划。

　　京东云指出，ChatGPT 在通用性方面已经展现出强大的能力，但在忠实度、可信度、精准度方面还存在一些不足，这主要是由于在中间层缺少垂直的产业知识和领域知识，难以在真实应用层广泛落地开花。

　　因此，基于产业需求，京东云旗下言犀人工智能应用平台将推出 ChatJD，定位为产业版 ChatGPT，旨在打造优势、高频、刚需的产业版通用 ChatGPT。ChatJD 将通过在垂直产业的深耕，快速达成落地应用的标准，并不断推动不同产业之间的泛化，形成更多通用产业版 ChatGPT，构建数据和模型的飞轮，以细分、真实、专业场景日臻完善平台能力，最终反哺和完善通用 ChatGPT 的产业应用能力。

　　京东集团副总裁何晓冬称，相较于传统聊天机器人，京东的场景更加垂直，必须解决用户的问题，更加聚焦于任务型多轮对话，考量的是对话的精准度、客户的满意度，满足成本、体验、价格、产品、服务等要素的要求。

　　ChatJD 将以「125」计划作为落地应用路线图，包含一个平台、两个领域、五个应用。

　　1 个平台：ChatJD 智能人机对话平台，即自然语言处理中理解和生成任务的对话平台，预计参数量达千亿级；2 个领域：零售、金融，得益于京东云在零售与金融领域 10 余年真实场景的深耕与沉淀，已拥有 4 层知识体系、40 多个独立子系统、3000 多个意图以及 3000 万个高质量问答知识点，覆盖超过 1000 万种自营商品的电商知识图谱，更加垂直与聚焦；5 个应用：内容生成、人机对话、用户意图理解、信息抽取、情感分类，涵盖零售和金融行业复用程度最高的应用场景，在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图11)

　　这些计划基本是京东既有工作的延续。在通用型 Chat AI 方向，京东云已经拥有包括京东智能客服系统、京小智平台商家服务系统、智能金融服务大脑、智能政务热线，言犀智能外呼、言犀数字人等系列产品和解决方案。拆解到细分技术领域，京东云在文本生成、对话生成、数字人生成方向等方向也已经做出了一些成果。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图12)

　　具体到语言生成方面，京东 NLP 团队提出的基于领域知识增强的预训练语言模型 K-PLUG 可以在一定程度上解决生成文本的「可控性」问题。目前，该模型已经覆盖了京东的 3000 多个三级品类，累计生成文案 30 亿字，应用于京东发现好货频道、搭配购、AI 直播带货等。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图13)

　　网易有道：将 AIGC 投入教育场景

　　据报道，网易有道 AI 技术团队已投入到 ChatGPT 同源技术 AIGC（AI Generated Content）在教育场景的落地研发中。

　　2 月 9 日，网易有道向媒体证实了这一消息，并表示近年来一直在 AIGC 上有持续性投入。去年底尝试 AIGC 在教育场景中的落地应用，包括但不限于 AI 口语老师、中文作文打分和评价等。据相关负责人透露，近年来，有道团队在神经网络翻译、计算机视觉、智能语音 AI 技术、高性能计算等关键技术方面均取得重要突破。

　　网易有道表示：「产品的最终形态团队还在讨论中，需要匹配用户需求来决定，智能硬件、在线课程都可能是考虑落地的场景。」

　　此前，AI 绘画成为了 AIGC 领域第一个破圈的应用，作为内容创作的新方式，AIGC 已经从早期辅助人类内容创造，发展到如今的独立完成内容创作的新阶段。

　　快手：已启动相关专项

　　作为一款国民级短视频 App 背后的公司，快手的业务和 AIGC 息息相关。因此，快手也对 ChatGPT 做出了回应。机器之心获悉，目前，快手正在开展大规模语言模型（LLM Large Language Model）正在开展大规模语言模型，并启动了相应专项，覆盖 LLM 模型训练、文案自动创作与生成、对话系统开发等领域。

　　内部有关人士介绍称，快手在 LLM 领域的研究，更聚焦于用户体验的提升，以及和业务场景的融合。例如，对话系统在快手中的主要应用场景包括虚拟人、电商智能客服、智能助理等人机交互或人人交互场景。相关研究的推进，将赋予 LLM 与人类自然交互的能力，对于 to B 类业务场景的扩展将有重要帮助。

　　科大讯飞：5 月进行产品级发布

　　作为 A 股上市公司，科大讯飞作为 AI 领域标的在 ChatGPT 概念兴起后涨幅不小。2 月 8 日晚间，科大讯飞在投资者互动平台回应称，ChatGPT 主要涉及到自然语言处理相关技术，属于认知智能领域的应用之一，公司在该方向技术和应用具备长期深厚的积累。科大讯飞 AI 学习机将成为该项技术率先落地的产品，将于今年 5 月 6 日进行产品级发布。

　　作为 AI 龙头的科大讯飞，在 NLP 方面同样有诸多研究积累。获悉，科大讯飞主导承建了认知智能全国重点实验室。这一实验室是科技部首批 20 家标杆全国重点实验室之一，多年来始终保持关键核心技术处于世界前沿水平，在去年曾获得 CommonsenseQA 2.0、OpenBookQA 等 12 项认知智能领域权威评测的第一。

　　与此同时，科大讯飞面向认知智能领域陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型，成为业界最广泛流行的中文预训练模型系列之一，在 GitHub获 13346 颗星，位列中文预训练模型星标数第一。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图14)

　　从 2009 年开始，科大讯飞就已着手进行算力基础设施建设，目前已建成 4 城 7 中心深度学习计算平台，算力不仅完全满足 AI 算法模型训练，还能面向开放平台数百万开发者和其他行业伙伴提供相关的服务。

　　科大讯飞也在进行算力的自主可控探索。目前讯飞研发训练服务器已经开始进入国产化，切换之后效率有的是原来平台的 70-80%，有的效率是超原来平台 100+%。而在算法上，也启动了推理服务器的国产替代；典型产品如学习机芯片已经全部切换成国产自主。

　　360：正在构建 ChatGPT 安全应用

　　继前两年布局新能源汽车、入局元宇宙后，360 近日也对外公布，计划推出类 ChatGPT 的 demo 版产品。「如果企业搭不上 ChatGPT 这班车，很可能会被淘汰，」在 2 月 9 日的活动中，周鸿祎表示。

　　抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云(图15)

　　在 2 月 7 日的答投资者提问会议上，360 表示有 200 多亿的资金能够支持 360 进行类 ChatGPT 技术的研究和投入，虽不及谷歌、百度，但也强于许多 A 股上市的搜索引擎企业。根据最新财报数据，360 在 2022 年第三季度披露的货币资金总额达 218.79 亿元。同时，360 还在调整投资战略，出售与自身主营业务协同性较低的投资项目，回笼更多的资金。

　　在技术积累上， 360 在 2019、2020 年左右便看到了技术变革的可能，成立了人工智能研究院，投入了相当的人力、算力去做人工 AI 场景，研发侧重点建立在自身的业务优势上，即安全 AI。

　　随着 ChatGPT 的应用推广以及各大科技巨头陆续入局类 ChatGPT 赛道，产业界和学界也越来越重视 ChatGPT 类模型可能带来的安全风险。

　　在当前，ChatGPT 有能力生成漏洞恶意攻击软件，随着这类 AI 的发展，未来还可能做到控制具有恶意攻击性的工具集群，对整个网络构架进行有步骤的攻击。在网络安全的需求下，安全 AI 可以帮助使用者发现恶意攻击、高级威胁和大型软件漏洞，应用潜力也将放大。

　　360 方面表示，当前对类 ChatGPT 的研发已经进行了数字安全 AI 识别。基于其训练的 AI 模型，刻画了专门针对于数字安全训练的大模型，并给它投喂了 360 安全卫士形成的安全类大数据。

　　不过，该类业务距商业化还有一定的距离。

　　目前，ChatGPT 所带来的这波 AI 热度还没有降温的趋势，未来还将有更多公司宣布入局。但正如搜狐创始人张朝阳所说，这是一件需要谨慎对待的事情，「ChatGPT 积累了许多年，涉及算力要有多少服务器，知识库、标注等很多问题，没有这些能力的公司跟风入局，会消耗掉许多资源。但具有人工智能 AI 以及有搜索能力的公司，也需要做好准备。」

　　未来机器之心将持续报道国内相关项目的进展，期待中国能做出不弱于 ChatGPT 的项目。

　　特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

<<ChatGPT爆红、元宇宙过气：科技巨头为何总是喜新厌旧？

用ChatGPT搞钱，“赚”不下去了>>

抢中国版ChatGPT首发的公司们｜文心｜模型｜京东云

您可能还会对下面的文章感兴趣：

随便看看