cha

AI掘金再扩散 ChatGPT如何赋能机器人行业?微软早已给出方向

  K图 BK1090_0

  今日早盘,板块震荡走高。截至午间收盘,、涨停;、、天智航涨超8%;、、等纷纷走高。

  image

  消息面上,随着ChatGPT等大语言模型技术的成熟,AI在领域的应用愈发受到关注。

  早在2月底,官网消息显示,ChatGPT已能操控。

  image

  通俗来说,在语言大模型ChatGPT的帮助下,工程师不需要手写代码,只需要用人类的语言描述想做的事情,ChatGPT可以将其转化为计算机代码。

  image

  而在语言大模型诞生之前,工程师调试机器人的方式是通过手写新代码。此外,不同的机器人可能需要不同的编程语言。因此,这不仅效率低下,且人力成本昂贵。

  从给出示例来看,用户可以通过ChatGPT操控多个机器人。

  例如,指挥机器臂拼出一个的Logo、让检查货架、指派摄像头找出能加热午饭的电器等等:

  从原理上来看,首先,微软开发了一系列API和高级函数库。这些函数库能够连接到机器人控制系统中管理底层硬件,以及执行基本运作的代码和功能模块。

  设计好函数库和API后,微软给ChatGPT编写了提示词(Prompt),用于描述目标任务。

  image

  值得注意的是,当用户给出的提示、指令越明确,AI生成内容/代码的效果就越好。因此,微软开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类型的机器人的Prompt策略。

  最终,用户能够直接通过人类语言指挥ChatGPT输出计算机代码,从而操控机器人。

  微软指出,基于人类语音操控机器人是一大技术进步。这能够让机器人技术走出实验室,并走进日常用户的生活场景中。“我们的工作只代表了机器人领域的语言大模型研究工作的一小部分,我们希望能够激发未来更多的应用。”

  谷歌也对大模型抱有同样的期许。谷歌和柏林工业大学团队的视觉语言模型PaLM-E不仅可以理解图像,还能生成语言,能够执行各种复杂的机器人指令而无需重新训练。谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭、工业机器人等。

  多家机构的也对大语言模型在机器人领域的应用前景十分看好。国盛在近期的中指出,大模型在1-5年内,能够应用于、工业视觉、行业化机器人等领域。展望5-10年后的发展,随着复杂多模态方案的成熟,AI大模型或将能够应用于通用机器人。

  亦指出,ChatGPT作为AIGC领域顶尖的模型,有望对现有生产力工具进行变革,其商业化有望加速推动语言AI及AI领域整体的显著进步。人机交互系统作为人形机器人的“大脑”,语音语义分析作为人机交互核心途径,可帮助机器人具备听、说、理解和思考的能力。伴随人机交互技术逐渐成熟,人形机器人商业化未来可期。其中,核心零部件在机器人成本中占比约70%,人形机器人相较于传统工业机器人,自由度大幅提升,预计将使用比工业机器人更多的与,核心零部件(、伺服等)需求有望大幅提升。


您可能还会对下面的文章感兴趣:

登录 注册 退出