擀面皮包饺子，MIT、CMU等的研究员让机器人自己学会了

原标题擀面皮包饺子，MIT、CMU等的研究员让机器人自己学会了

澎湃新闻记者邵文

你能想象让机器人揉面团，擀面皮，包饺子吗？对机器人来说，操纵衣物、面团等柔软无坚固形状的可形变材料一直是个棘手的问题。面团的形状可以以多种方式变化，而这些变化很难用方程式表示。

此外，从面团中创建新形状需要多个步骤并使用不同的工具。对于机器人来说，学习具有长步骤序列的操作任务尤其困难，因为学习通常是通过反复试验完成的，其中有许多可能的选择。

当地时间3月30日，麻省理工学院、卡内基梅隆大学和加州大学圣地亚哥分校的研究人员为这种任务提出了一种更好的方法。他们创造了一种“两阶段学习框架”，名为“Teacher”（老师）的算法解决机器人要完成任务所必需的每个步骤，然后它训练“Student”（学生）机器学习模型去学习关于何时及如何执行任务所需的每项技能的抽象概念，比如用擀面杖。有了这些知识，系统就会推理出如何执行技能来完成整个任务。

研究人员认为，这种他们称之为DiffSkill的方法可以在模拟中执行复杂的操作任务，例如切和揉面团，或从砧板周围收集面团，同时优于其他机器学习方法。

除了制作披萨、饺子外，这种方法还可以应用于机器人需要操纵可形变物体的其他环境中，如为老年人或运动障碍者喂食、洗澡或穿衣的护理机器人。

“这种方法更接近我们人类计划行动的方式。当一个人执行一项长期任务时，我们并没有写下所有的细节。我们有一个更高级别的计划者，它大致告诉我们在此过程中需要实现哪些阶段以及一些中间目标，然后我们执行它们，”论文作者之一，MIT计算机科学与人工智能专业的研究生李云珠说道。

分开来看具体的工作原理。DiffSkill框架中的“Teacher”是一种轨迹优化算法，可以解决物体初始状态和目标位置很接近的短视界（short-horizon）任务。轨迹优化器在模拟现实世界的物理模拟器中工作（称为可微物理模拟器，它将“Diff”放入“DiffSkill”中）。“Teacher”算法使用模拟器中的信息来学习面团在每个阶段必然如何移动，一次一个，然后输出这些轨迹。

然后“Student”神经网络学会模仿老师的动作。作为输入，它使用两个摄像头图像，一个显示当前状态的面团，另一个显示任务结束时的面团。神经网络生成一个高级计划，以确定如何将不同的技能联系起来以达到目标。然后，它为每个技能生成特定的、短视界的轨迹，并将命令直接发送到工具。

研究人员使用这种技术对三种不同的模拟面团操作任务进行了实验。在一项任务中，机器人使用抹刀将面团举到砧板上，然后使用擀面杖将其压平。在另一个例子中，机器人使用抓手从柜台上收集面团，将其放在抹刀上，然后将其转移到砧板上。在第三个任务中，机器人用刀将一堆面团切成两半，然后使用夹具将每一块面团运送到不同的位置。

“DiffSkill能够胜过依赖强化学习的流行技术，在强化学习中，机器人通过反复试验来学习任务。事实上，DiffSkill是唯一能够成功完成所有三个面团操作任务的方法。有趣的是，我们发现‘Student’神经网络甚至能够胜过‘Teacher’算法，”卡内基梅隆大学（CMU）研究生林兴宇说道。

林兴宇认为，这个框架为机器人获得新技能提供了一种新颖的方式，可以将这些技能链接起来，以解决更复杂的任务。这些任务超出了以前的机器人系统的能力。

因为他们的方法侧重于控制工具（抹刀、刀、擀面杖等），所以它可以应用于不同的机器人，但前提是它们要使用研究人员定义的特定工具。未来，他们计划将工具的形状整合到“Student”网络的推理中，以便将其应用于其他设备。

研究人员打算通过使用3D数据作为输入来提高DiffSkill的性能，而不是使用难以从模拟传输到现实世界的2D图像。他们还希望使神经网络规划过程更高效，并收集更多样的训练数据，以增强DiffSkill对新情况的泛化能力。从长远来看，他们希望将 DiffSkill应用到更多样化的任务中，包括布料操作。

这项研究由卡内基梅隆大学（CMU）研究生林兴宇，加州大学圣地亚哥分校研究生黄志奥，麻省理工学院脑与认知科学系认知科学与计算职业发展教授Joshua B． Tenenbaum，CMU助理教授David Held，以及MIT-IBM Watson AI Lab的研究科学家 Chuang Gan合作完成。其得到了美国国家科学基金会、LG电子、麻省理工学院-IBM 沃森人工智能实验室、美国海军研究办公室和国防高级研究计划局的部分支持。

关键词：

铁路清明小长假运输今日启动严控载客率调整涉疫地区列车	“烧钱”模式生变互联网巨头宣布盈亏时间表
国家医保局：新冠疫苗已接种32亿剂次 1200余亿元费用由医保基金和财政共同负担	今年前2个月全球动力电池需求大增宁德时代市占率进一步上升
擀面皮包饺子，MIT、CMU等的研究员让机器人自己学会了	深交所四问中交地产：基本面是否发生重大变化是否涉嫌内幕交易
“天价大白菜”再现上海市场监管部门立案调查	下一个冰墩墩在哪里
两部委发布《“十四五”能源领域科技创新规划》	连亏三年还要加快开店达美乐中国特许经营商赴港上市
福建宁德“北大培文”冠名事件跟踪：已更名博雅培文	支付行业年内最大罚单！银盛支付因四项违法行为被罚2245万
国家能源局等两部门：支撑在确保安全的前提下积极有序发展核电	行业两轮洗牌后十荟团濒临出局社区团购走向何方？
深房中协就《深圳市二手房交易经纪服务指引》征集意见	天风证券第二大股东人福医药清仓：股东里国资占比升至约九成
中国物流与采购联合会：3月中国电商物流指数为104点，比上月回落4.9个点	作价3.69亿甩卖酒店资产后金花股份又花近1亿买房意欲何为？
外媒：福特在美召回逾70万辆汽车	佩斯科夫：壳牌石油公司暂时将无法从俄方购买天然气
宝能集团董事长姚振华：现阶段流动性困难化解工作取得阶段性进展	“窝里横”：原生家庭问题的“后遗症”？
今年全国能源产量达44.1亿吨标准煤左右	网友称未开盖燕京啤酒中发现烟头厂家：请拿酒来检测
瑞幸暴雷700天：“叛徒”、枭雄与二次上市	康复费用成孤独症家庭难以承受之重
打破赏花游天花板做好“赏花经济”下篇文章	一根翠竹挑起百亿元产业
辽宁今年将扩种大豆超10万亩	浙江发布国有房屋免租金细则
新规落地，您的外卖“上锁”了吗	显卡价格大跌背后：挖矿潮退、供给回暖
南京七欣天被曝用小蟹钳偷换大蟹钳当事顾客：已投诉至当地监管部门	或涉敏感个人数据！比亚迪、东风日产紧急停用这个功能！
央视曝光盲发快递骗局	1克等于0.1毫克海洛因的“救命药”，国家准备临时进口！此前患儿家长联名求助
这一省会重磅官宣：外地人无需社保直接买房！一个月内3座大城对楼市出手，啥信号？	张国荣生前最后一场演唱会视频修复重映
融创中国一笔境内债获得展期，增加多项增信措施	比亚迪董事长王传福：眼下原材料价格暴涨是行业需要克服的挑战
“包租公”华润置地一年收租174亿，总裁李欣：30%的毛利率将一去不返	一季度百强房企销售下降47%，房价涨幅为近七年同期最低
青岛保时捷中心擅自使用冰墩墩被罚	脸书被曝光雇水军诋毁竞争对手，掀起反对字节跳动旗下TikTok的舆论行动
华林证券：海豚股票App将继续在今日头条及抖音的生态体系内运营	转型前最后的瘦身：多家教育上市公司“1元”转让学科类培训业务
一套制服采购价四千元？采购代理机构：包含冬夏多套制服	富力地产2021年净亏损87亿元净负债率123%
万达接手建业商业？刚刚，回应来了	雅居乐2021年净利润90.98亿元同比下降25.7%
投遍了全球互联网巨头，但俄罗斯巨鳄DST最近很苦恼	独家爆料！“她们”，吃了狗粮咬祖国
数字技术与医疗服务深度融合、医护人员同理心更重要未来十年医疗行业将呈现这些趋势	三盛控股2021年净利润5.99亿元同比下降25.99%
知名品牌拉夏贝尔关店近9000家，一年亏损8亿！	重塑商业模式国美按下发展快进键
王健林牵手胡葆森万达将负责建业地产商业项目运营	蔚来汽车3月交付量为9985辆同比增长37.6%
小鹏汽车3月交付量为15414辆同比增长202%	中方将来会在所罗门建军事基地吗？外交部回应
2021年业绩亮眼国美秀出肌肉	巴奴否认内涵海底捞：没有评价任何餐饮企业，为什么要道歉？
拉林铁路迎来首趟集装箱专列	“三桶油”2021年成绩单：加大油气勘探开发推进绿色低碳转型
拼多多诉争拼夕夕商标被驳回法院：因与“拼多多”相似	太子乐回应广告文案营销母亲：未经授权，已要求删除
三部门“出招” 网络直播营利行为进一步规范	1.5万亿元！大规模留抵退税直接利好小微企业和制造业等行业
去年全球电力碳排放创新高，六成电力需求增量仍靠煤炭	不论怎么涨，打工人的上班神器，还得是它
创新监管模式市场监管等五部门联合推进汽车安全沙盒监管	中汽协：2022年3月中国汽车经销商库存预警指数为63.6%
上坤地产：2021年归属股东净利润2.5亿元，同比减少29.8%	德兴铜矿大山选矿厂发生死亡事故江西铜业称尚不清楚会否停业整顿
商务部副部长王受文：希望跨国车企抓住机遇进一步扩大在华投资完善产业链供应链布局	年报披露不足一个月京东曝大裁员？新业务物流双亏背后有何隐情？
京东裁员仍在继续：办理离职员工已排到1000多号	助力稳产保供，用好数字技术这些实招
朗诗四年内三度更名 2021年亏损6.96亿元	比克电池：公司经营不会受到重组结果影响 2021年已实现扭亏
上万元一晚的院子半月前就满房！本地游带火民宿你会去吗？	富力地产：2021年净亏损87.39亿元
富力地产：2021年营收同比减少11.05%至764亿元	研究生复试331分逆袭390分？北京协和医学院回应
南航2021年报发布：净亏损超120亿元境外航线载客量减少七成	智库圆桌：多位专家探讨如何全面提升油料生产能力
济宁医学院谣教务处长之子被“北京协和医学院”录取：两人无任何血缘关系	广种油菜籽充实“油瓶子”
不能提供冰墩墩授权证明就擅自使用青岛保时捷中心被罚	业绩现负增长后仍大手笔分红双汇发展在下什么棋
会计机构谈人参色变，百亿未名医药年报难产	警惕手机软件里的“内鬼”
主要产油国维持原定适度增产计划	里工实业：机器换人事业留人
职业打假江湖：是“英雄”还是敲诈勒索？	淘宝内测支持微信支付自我优待壁垒正在被打破
前两个月我国国际货物和服务贸易进出口规模68127亿元同比增长15%	鸿铭智能拟募资近3亿扩充产能，销售费用率因何高于同行一倍
周黑鸭放下“高贵”：盈利能力疲软，放开特许经营	就业季遭遇疫情，上海海洋大学党委书记“直播带人”

擀面皮包饺子，MIT、CMU等的研究员让机器人自己学会了

相关阅读

精彩推送

每日推荐

俄外长称美欧要求各国停止与中俄开展经贸等各领域合作..

要闻

资讯新闻