首页 > 经济·科技

实现自然的人机交互 微软将ChatGPT应用于机器人

2023-03-07 15:29:49

来源:每日经济新闻

  每经记者 郑雨航 每经编辑 兰素英

  “你有没有想过,你只需告诉你的家庭助理机器人:‘请加热我的午餐’,它就会自己找到微波炉。这是不是很神奇?”

  近日,微软在其官网发表了一篇名为《机器人 ChatGPT:设计原则和模型能力(ChatGPT for Robotics:Design Principles and Model Abilities)》论文,公布了他们正在把ChatGPT应用于机器人上的研究成果。

  文中称,这项研究的目标是观察ChatGPT是否可以超越文本思考,并对物理世界进行推理来帮助完成机器人任务。人类目前仍然严重依赖手写代码来控制机器人。该团队一直在探索如何改变这一现实,并使用OpenAI的新人工智能语言模型ChatGPT实现自然的人机交互。

  研究人员希望ChatGPT能够帮助人们更轻松地与机器人互动,而无需学习复杂的编程语言或有关机器人系统的详细信息。其中的关键难题就是教ChatGPT如何使用物理定律、操作环境的背景以及了解机器人的物理行为如何改变世界状态,并以此来解决指定的任务。

  针对微软的此项研究,伦敦大学学院(UCL)名誉教授和计算机科学家彼得·本特利博士(Dr。Peter John Bentley)在接受《每日经济新闻》记者采访时表示,人类在未来用AI工具如ChatGPT来控制机器人是完全可行的路径。

  但他同时强调,就目前而言,ChatGPT还存在很多漏洞,在功能性、保障性,以及安全性上缺乏基本的能力。

  日前,微软发布了新版必应(Bing)互联网搜索引擎和Edge浏览器,这些浏览器由ChatGPT制造商OpenAI的最新技术提供支持。图为一名工作人员在演示基于人工智能的微软必应搜索引擎和Edge浏览器 视觉中国

  ChatGPT如何控制机器人

  ChatGPT是一种基于大量文本和人类交互语料库而训练的语言模型,使其能够对各种提示和问题生成连贯且语法正确的响应。

  研究人员在该文章中表示,当前的机器人运转始于工程师或技术用户,他们需要将任务的要求转换为系统代码。工程师在机器人运转的循环中,需要编写新的代码和规范来纠正机器人的行为。总的来说,这个过程缓慢、昂贵且低效,因为不仅需要具有深厚机器人知识的高技能用户,而且需要用户参与多次交互才能使机器人正常工作

  而ChatGPT解锁了一种新的机器人范式,并允许潜在的非技术用户在循环中,在监控机器人性能的同时向大型语言模型(LLM)提供高级反馈。

  通过遵循设计者的设计原则,ChatGPT 可以为机器人场景生成代码。在无需任何微调的情况下,人们就可以利用LLM的知识来控制各种任务的不同机器人外形。通过反复试验,微软的研究人员构建了一种方法和设计原则,专门为机器人任务编写提示:

  首先,定义一组高级机器人 API 或函数库。该库可以针对特定的机器人类型进行设计,并且应该从机器人的控制栈或感知库映射到现有的低层次具体实现。为高级 API 使用描述性名称非常重要,这样 ChatGPT 就可以推理它们的行为。

  接下来,为 ChatGPT 编写一个文本提示,描述任务目标,同时明确说明高级库中的哪些函数可用。提示还可以包含有关任务约束的信息,或者 ChatGPT 应该如何组织它的答案,包括使用特定的编程语言,或使用辅助解析组件等。

  再次是,用户通过直接检查或使用模拟器来评估 ChatGPT 的代码输出。如果需要,用户使用自然语言向 ChatGPT 提供有关答案质量和安全性的反馈。

  最后,当用户对解决方案感到满意时,就可以将最终的代码部署到机器人上。

  ChatGPT+机器人将带来什么

  文章中,微软的研究团队展示了在人们的工作中,ChatGPT解决机器人难题的多个示例,以及在操纵无人机和导航领域的复杂机器人部署。

  研究人员让 ChatGPT 访问控制一台真正的无人机的全部功能,事实证明,非技术用户和机器人之间可以用非常直观且基于自然语言的交流。

  当用户的指令模棱两可时,ChatGPT会提出澄清问题,并为无人机编写复杂的代码结构,例如飞行之字(zig-zag)图案,以便可视化地检查货架;甚至还能给用户来一张自拍。

  研究人员要求 ChatGPT 编写一个算法,让无人机在不撞上障碍物的情况下,在空中达到目标。研究人员告诉该模型,这架无人机有一个前向距离传感器,ChatGPT立即为算法编码了大部分关键构建块。

  研究人员表示,这项任务需要人类进行一些对话,但ChatGPT 仅使用自然语言反馈进行本地化代码改进的能力给他们留下了深刻的印象。

  微软的研究人员还在模拟的工业检测场景中使用了ChatGPT,并使用了Microsoft AirSim模拟器,该模型能够有效地解析用户的高级意图和几何线索,以准确控制无人机。

  当把ChatGPT用于机械臂的操作场景时,研究者使用对话反馈来教模型如何将最初提供的 API 组合成更复杂的高级函数,即,ChatGPT自己内部编码的函数。使用基于课程的策略,该模型能够将这些学到的技能逻辑地链接在一起,以执行堆叠块等操作。

  此外,该模型还展示了一个有趣的示例,即在用木块构建微软logo时桥接文本域和物理域。ChatGPT不仅能够从其内部知识库中调用微软的logo,还能够用SVG的代码“绘制”这个logo,然后利用上面学到的技能来确定现有的机器人动作和可以组成它的物理形式。

  谈及微软在论文中的演示示例,本特利博士告诉《每日经济新闻》记者,“微软已经展示了一些简单的操作,ChatGPT可以用来生成计算机代码,这些代码可以控制机器人,所以用ChatGPT来控制机器人是完全可行的方案。”。

  但本特利博士认为,在现阶段来说,ChatGPT虽然能够生成计算机代码,但机器人控制的问题在于,计算机代码可能需要为特定的硬件量身定制才能正常工作。ChatGPT目前使用的是它已经学习到的代码示例,它(ChatGPT)或许并不兼容最新的硬件。

  “所以,ChatGPT不太可能与人类开发人员相提并论。它只是提供了一个简单的捷径,可以帮助人们学习基础知识,但它缺乏作为开发人员的基本能力。”

  ChatGPT输出内容仍需评估

  研究人员在该文中表示,在做某事(行动)之前能够感知世界是打造机器人系统的基础。因此,他们决定测试 ChatGPT 对这个概念的理解,并要求它探索一个环境,直到找到用户指定的对象。研究者允许模型访问对象检测和对象距离 API 等功能,并验证它生成的代码是否成功实现了感知-操作循环(Perception- action loops)。

  在实验角色中,研究者进行了额外的实验,以评估ChatGPT是否能够根据传感器实时反馈决定机器人应该去哪里,而不是让ChatGPT生成一个代码循环来做出这些决定。有趣的是,结果验证了人们可以在聊天的每一步提供相机图像的文本描述,并且ChatGPT模型能够弄清楚如何在机器人到达特定物体之前控制它。

  该文称,微软发布这些技术的目的是将机器人技术推广到更广泛的受众,研究人员相信,基于语言的机器人控制系统是把机器人从科学实验室带到日常用户手中的基础。

  但是,微软的研究者也表示,ChatGPT 的输出不应该在没有仔细分析的情况下直接部署在机器人上。通过在模拟环境中获得实验结果,能够在未来现实部署之前对算法进行评估,并采取必要的安全预防措施。

  本特利博士对此表示认同,他向《每日经济新闻》记者进一步解释称,就目前而言,ChatGPT还存在很多漏洞,在功能性、保障性,以及安全性上缺乏基本的能力。

  “例如,ChatGPT可以编写计算机代码,但它不能做任何测试,也不知道它输出的代码运行起来是否有效。研究人员需要更好的反馈循环,以便测试结果在改进的代码中,否则ChatGPT的输出可能仍然是不合适的(不安全、或不能工作)。”

【责任编辑:长风】
  • 相关阅读
  • ChatGPT来了,中国人工智能该如何应对

      【两会声音】  ◎本报记者 刘园园  在几年前召开的全国两会上,来自谷歌的围棋人工智能“阿尔法狗”曾引发高度关注。今年两会,人工智能研究机构OpenAI发布的ChatGPT聊天机器人站在镁光灯下,又成为代表委员们的热议对象。  在持续刷屏的热闹背后,ChatGPT到底将带来什么样的产业变革?中国人工智能行业又该如何应对?  不...

    时间:03-07
  • (两会观察)ChatGPT“热出圈” 未来的人工智能会走多远?

      中新社北京3月6日电 (记者 马帅莎)“踢足球都是盘带、射门,但是要做到梅西那么好也不容易。”中国科技部部长王志刚5日在今年全国两会的首场“部长通道”上以踢足球为喻回应ChatGPT话题。  这是当下“智能聊天网红”ChatGPT火热程度的一个缩影,与之相关的人工智能也成为今年全国两会期间的热议话题。  让它备受关注的...

    时间:03-06
  • (两会速递)中国科技部部长以足球为喻谈ChatGPT

      中新社北京3月5日电 (记者 陈溯)“踢足球都是盘带、射门,但是要做到梅西那么好也不容易。”当被问及如何看待ChatGPT时,中国科技部部长王志刚5日在北京用踢足球作比喻指出,“从这一点看,ChatGPT在技术进步上,特别是保证算法的实时性与算法质量的有效性上,非常难。”  当日,十四届全国人大一次会议首...

    时间:03-05
  • 科技部部长用梅西解释ChatGPT

      3月5日上午9时,第十四届全国人民代表大会第一次会议在人民大会堂举行开幕会。开幕会结束后举行“部长通道”采访活动,邀请部分列席会议的国务院有关部委负责人接受采访。  南方都市报N视频记者  ChatGPT是近期国内外市场高度关注的热点,国内企业也宣布有相关业务布局。请问怎么看待这个现象?我...

    时间:03-05
  • (两会声音)全国政协委员周鸿祎:提案聚焦ChatGPT、城市安全和数字化“共同富裕”

      中新网天津3月1日电 (记者 王君妍)2023年全国两会临近。全国政协委员、360集团创始人周鸿祎今年将携三份提案上会,分别关注人工智能大模型技术发展、城市数字安全和中小微企业数字化“共同富裕”。周鸿祎表示,三份提案可以用一句话总结:上山下海扶助小微。  “上山”是上科技高山。近期ChatGPT引发全球热议,周鸿祎认为,以Ch...

    时间:03-01
  • (两会声音)中国离自己的ChatGPT还有多远?

      中新社北京2月28日电 (记者 夏宾)由美国人工智能公司OpenAI推出的大语言模型ChatGPT吸引了全球目光,其热度在中国也持续高涨。有人发出疑问,中国离自己的ChatGPT还有多远?  全国政协委员、360集团创始人周鸿祎对中新社记者表示,如果把ChatGPT看作“能与人类对话”的机器人,那就太“小儿科”了。它的出现,或许是人工智能发展...

    时间:02-28
  • 俄千岛群岛火山喷发灰柱高达3000米 已设置危险代码

      中新网2月28日电 据俄罗斯卫星通讯社28日报道,俄罗斯科学院远东分院火山学与地震学研究所堪察加火山喷发应急响应小组官网称,位于俄千岛群岛的埃别科火山喷发出高达3000米的灰柱。  消息指出:“爆炸喷发的灰柱高达2500-3000米。”  灰羽在风力作用下向火山东南漂移3公里,已经设置了航空危险橙色...

    时间:02-28
  • 俄千岛群岛火山喷发灰柱高达3000米 已设置危险代码

      中新网2月28日电 据俄罗斯卫星通讯社28日报道,俄罗斯科学院远东分院火山学与地震学研究所堪察加火山喷发应急响应小组官网称,位于俄千岛群岛的埃别科火山喷发出高达3000米的灰柱。  消息指出:“爆炸喷发的灰柱高达2500-3000米。”  灰羽在风力作用下向火山东南漂移3公里,已经设置了航空危险橙色代码。  专家们认为,火山...

    时间:02-28
  • Snap整合ChatGPT技术推出聊天机器人:不要和它说秘密

      澎湃新闻记者 范佳来  Snapchat也推出了属于自己的聊天机器人,杀入一片火热的AI战局。  当地时间2月27日,据科技媒体the Verge报道,美国社交软件公司阅后即焚(Snapchat)推出一款由OpenAI最新版ChatGPT提供支持的聊天机器人。根据Snapchat CEO埃文·斯皮格尔(Evan Spiegel)介绍,这款聊天机器人名为“My AI”,将固定在应用...

    时间:02-28
  • 马斯克要杀回马枪?被曝有意开发ChatGPT替代品,已接洽研发人员

      澎湃新闻记者 吴遇利  在聊天机器人ChatGPT爆红之后,前OpenAI联合创始人马斯克也坐不住了。  当地时间2月27日,据美国科技媒体The Information报道,特斯拉CEO·埃隆马斯克最近几周正在与人工智能研究人员接洽,商讨成立一个新的研究实验室,以开发ChatGPT的替代品。  ChatGPT是初创公司OpenAI开发的聊天机器人,近期备受市...

    时间:02-28
版权声明:内容资源均来自于网友投稿、互联网整理编辑,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件举报,一经查实,本站将立刻删除。