近日,机器人与自动化领域全球顶会 ICRA 2025 在美国亚特兰大开幕。由中国科学院自动化研究所与灵宝 CASBOT 共同提出的关于“增强物理人机协作中的人类意图估计和人机角色分配”方法(DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration)获 ICRA 2025 录用。
在物理人机协作(physical Human-Robot Collaboration, pHRC)中,准确的人类意图估计和合理的人机角色分配对安全高效的协作至关重要。现有的依赖短期运动数据进行意图估计的方法缺乏多步预测能力,阻碍了机器人感知长期意图变化和自主调整人机分配的能力,从而导致潜在的人机分歧。为了解决这些问题,中国科学院自动化研究所与灵宝 CASBOT 共同提出了一种基于对偶 Transformer 的人机协作框架(Dual Transformer-based Robot Trajectron, DTRT),该框架采用分层结构,利用人类引导的运动和力数据来快速捕获人类意图变化,从而实现准确的轨迹预测和动态机器人行为调整,最终实现有效的物理人机协作。
基于双变压器的机器人轨迹器,用于人类意图估计和角色分配
具体而言,DTRT 中的人类意图估计利用两个基于 Transformer 的条件变分自编码器(Conditional Variational Autoencoder, CVAE),将机器人在无障碍物情况下的运动数据与避障时人类引导的轨迹和力相结合。此外,我们采用基于人类施加力的微分合作博弈论(Differential Cooperative Game Theory, DCGT)来综合两种预测,确保机器人的行为与人类的意图一致。与现有方法相比,DTRT 将人类动态纳入长期预测,提供准确的意图理解,实现合理的角色分配,提升机器人的自主性和可操作性。
物理人机协作(pHRC)在制造、医疗保健和服务中至关重要。需要有效的策略来确保机器人能够无缝地与人类协作,进行准确的估计意图,并动态调整行为,从而协助人类。因此,精确的人类意图估计和合理的人机角色分配是提高 pHRC 性能的关键挑战。
基于人类意图对未来轨迹的准确预测对于机器人辅助的有效性和 pHRC 的安全性至关重要。在存在潜在危险的复杂环境中,例如当机器人遇到未知障碍物时,人类意图的快速变化给意图估计带来了重大挑战。
目前的方法主要依赖于短期运动数据,如位置和速度,这限制了检测人类意图变化,将影响预测的准确性和安全性。
此外,短期数据会降低长期协作中意图估计的有效性。因此,研究将人类施加的力量整合到 pHRC 中的长期预测方法对于实现准确的意图估计至关重要。此外,人机角色分配涉及一种复杂的机制,用于在人类和机器人之间分配任务控制权。这一过程将实时协调人机关系,减少分歧并提高机器人的辅助水平。现有方法主要依赖阻抗 / 柔顺性控制,通过修改模型参数来确定角色。在各种方法中,基于博弈论的角色分配模拟多参与者之间的协作过程,将目标设定为最小化成本函数以实现最优的人机协同关系。然而,确保机器人行为与人类意图一致,同时保持自主性和灵活性仍然是一个重大挑战。
实验结果表明, DTRT 在预测精度方面具有显著优势,在多个物理人机协作指标上表现出卓越的性能,有效降低了人机分歧并提高了机器人的辅助水平,具有巨大的应用潜力。DTRT 的核心优势在于以下三点:
在物理人机协作性能上,使用了以下指标:
在实验中,我们对障碍物进行替换和随机定位。结果表明,DTRT 在物理人机协作场景下优于现有方法。DTRT 的平均人机协作角度为 76.4°,平均机器人辅助水平指数为 1.5,人机系统在 61.8% 的时间内处于协作状态。此外,人机角色分配有效地平衡了机器人的自主性和人类引导,使得仅有 3.5 J 的人类机械功。总体而言,DTRT 准确估计了人类意图变化,合理分配了领导者和追随者的角色,从而减少了人机分歧,提高了机器人的辅助水平,促进了安全高效的物理人机协作。
DTRT 与现有方法在指标上的定量对比
DTRT 的提出,不只是一个算法突破,更是一次“人机关系”重构的尝试:它为人形机器人发展提供了一条兼具通用性与工程价值的技术路径。未来,DTRT 的研究思路及其核心机制有望在灵宝 CASBOT 所聚焦的工业制造、复杂作业、服务协同等多个实际应用场景中持续拓展与深化。
文章来自于“InfoQ”,作者“灵宝 CASBOT 团队”》