摘要
本发明提供了机器人操作轨迹的人类偏好标注方法及相应的机器人学习系统,包括基于属性和原则的数据库聚类方法、后端主动查询模型和前端混合主动用户界面;机器人轨迹数据集通过三个主要原则进行聚类:安全性、效率和性能;对于每个原则,收集可量化的属性,在每个时间步骤中将其连接成一个主向量,并形成整个轨迹的主向量时间序列。然后,利用DTW根据每个主向量序列对轨迹数据集进行聚类;在根据每个原则收集偏好时,后端模型会计算我们在偏好引出过程中根据用户需求设计的几个指标的加权平均值,例如比较轨迹对的难度、人类评估者之间的分歧以及标记和未标记轨迹对的偏斜度;前端呈现轨迹视频对,供人类评估者比较和指定他们的偏好。
技术关键词
机器人学习系统
标注方法
轨迹
人类
特征值
配对方法
数据
收集机器人
人工智能模型
生成机器人
查询模型
聚类方法
机械人
指标
模块
关键帧
视频帧
系统为您推荐了相关专利信息
搅拌摩擦焊接设备
搅拌工具
焊接机器人驱动
位置补偿机构
坐标定位装置
人形机器人上肢
大语言模型
语音
抓取手势
机械臂
振动传感器
动态时间规整
网络拓扑结构
信号采集模块
加窗傅里叶变换
机车牵引电机
轴温报警
计算机程序指令
冷却风机
风量
标注平台
数据标注方法
多轮对话
深度语义分析
信息模块