摘要
本发明提供了机器人操作轨迹的人类偏好标注方法及相应的机器人学习系统,包括基於属性和原则的数据库聚类方法、後端主动查询模型和前端混合主动用户界面;机器人轨迹数据集通过三个主要原则进行聚类:安全性、效率和性能;对於每个原则,收集可量化的属性,在每个时间步骤中将其连接成一个主向量,并形成整个轨迹的主向量时间序列。然後,利用 DTW 根据每个主向量序列对轨迹数据集进行聚类;在根据每个原则收集偏好时,後端模型会计算我们在偏好引出过程中根据用户需求设计的几个指标的加权平均值,例如比较轨迹对的难度、人类评估者之间的分歧以及标记和未标记轨迹对的偏斜度;前端呈现轨迹视频对,供人类评估者比较和指定他们的偏好。
技术关键词
机器人学习系统
标注方法
轨迹
查询模型
聚类方法
人类
标记
序列
数据
视频
指标
系统为您推荐了相关专利信息
地质结构模型
空间探测方法
天然源面波
钻进系统
面波频散曲线
遗传粒子群算法
关节
机械臂运动学
粒子群混合算法
末端执行器
环境预报信息
辅助决策方法
风险
全局路径规划
资源
动态客流
编制方法
计划
混合整数规划模型
变邻域搜索算法
漏洞挖掘平台
强化学习算法
预训练模型
漏洞知识库
对抗性