translate English

机械知识

你的下一位传菜员可能是它:科学家用大模子让

作者:888集团官网正版 发布时间:2026-02-24 16:05

  张世琦举例说道:“这很像餐厅里办事员上菜的情景。一方面,办事员坐得离桌子越近越好,另一方面又要取顾客、桌子、椅子以及其他妨碍物连结必然的距离。我们用视觉方案来处理坐位问题,以兼顾机械手臂和基座的机能表示。”。

  研究团队对挪动操做(MoMa)范畴进行研究,沉点关心机械人同时施行和挪动抓取的使命。他们还出格关心若何正在给定未明白指定的方针的环境下,计较每个物体该当放置的和体例。

  以具体场景为例,来理解机械人正在使命规划和活动规划之间进行交互:假如机械人想要将餐具摆放到十人餐桌,有人已就座。

  张世琦对 DeepTech 暗示:“我们初次将狂言语模子的常识学问取使命取活动规划(TAMP,Task and motion planning)使命连系。该系统表示出强顺应能力,支撑正在动态妨碍的中进行及时调整。”?。

  研究团队打算正在将来的研究中继续改良相关问题。例如,正在现实中可能涉及节制等复杂的问题;进一步摸索机械人正在抓取时节制器是若何实现的;机械人犯错后若何恢复;为机械人供给更好的摄像头供给更丰硕的视觉消息;考虑机械人边走边操做的环境等等。

  为验证该系统的结果,该团队别离正在实正在机械人和仿实中进行尝试。实正在尝试涵盖三个分歧复杂度的使命,包罗摆放分歧数量的餐具物品,并正在有无妨碍物的环境下施行多次试验。成果显示,LLM-GROP 正在可生成合理的对象结构的前提下,还能正在复杂中高效地和操做。

  这项研究来自美国纽约州立大学宾汉姆顿分校张世琦传授团队取合做者,他们提出了一种名为 LLM-GROP 的方式,使机械人可以或许正在复杂中高效地完成多对象从头陈列使命,正在实正在中的使命成功率达 84。4%。

  表丨正在简单使命中最高得分是 3。8 分,正在复杂使命中,最高得分是 3。93 分。虽然表示未达到经验丰硕的人类办事员程度,但表示出成长潜力(来历:IJRR)。

  纽约州立大学宾汉姆顿分校张笑寒博士(目前任职于动力 AI 机械人尝试室)、丁琰博士(目前任职于鹿明机械人)、博士生速水陽平(Yohei Hayamizu)和扎伊纳布·阿尔塔韦尔(Zainab Altaweel)是配合第一做者,张世琦传授担任通信做者。这项研究的合做者还包罗美国人形机械人厂家 Agility Robotics 克里斯・帕克斯顿(Chris Paxton)、美国得克萨斯大学奥斯汀分校彼得・斯通(Peter Stone)传授和朱玉可传授。从左至左顺次为:张笑寒、丁琰、速水陽平(Yohei Hayamizu)和扎伊纳布·阿尔塔韦尔(Zainab Altaweel)(来历:材料图)。

  正在使命层面,它需要判断具体从桌子左边仍是左边走过去更平安。取此同时,机械人正在上菜时需要决策先放盘子仍是杯子等。而活动规划的问题则是:餐桌旁边已有椅子,该当若何调整坐姿,能让放盘子的成功率和效率都比力高。

  研究人员还对比了分歧大模子正在系统中的感化,发觉 GPT-4 正在大都使命中表示最佳,而 Gemini 和 Claude 则正在某些特定使命中展示劣势。

  研究人员操纵大模子的丰硕常识学问,例如餐具的摆放体例,来推进使命级和活动级规划。此外,他们还利用计较机视觉方式来进修选择根本的策略推进 MoMa 行为。

  该研究为办事机械人界中的语义使命施行供给了新思,合用于挪动操做平台,把复杂使命分化成一步步动做,又需要正在持续空间里做轨迹规划的环境。

  现正在,它就能通过取狂言语模子交换,学到怎样摆的常识性学问,然后按照要求把餐具合理地摆出来。

  过去,若是想让机械人安插餐桌,需要给它明白的指令,好比:往前走 2 米,抬起 45 度,食物需要摆正在餐盘中,叉子摆到盘子的左侧…。

  “我们正在此次研究中第一次把大模子用正在使命活动规划以及挪动操做的问题上,将来我们还将摸索正在现实场景中更多风趣的问题。”张世琦暗示。



快捷导航

888集团官网正版集团于2009年在江苏盐城成立,是一家专业致力于生产工业阀门和石油机械的高新技术企业。

点击下方按钮联系我们获取更多信息

联系我们