摘要
本发明提供了多视角视频奖励机制学习系统及方法,包括:多视角视频评估分系统,利用多视角视频学习框架MVR,根据多视角视频学习评估机器人行为;视觉反馈奖励反馈策略分系统,通过视觉语言大模型,根据任务文本描述生成视觉反馈;根据最新的状态相关性评估,获得准确的奖励反馈,进而更有效地调整策略;视觉反馈任务奖励平衡分系统,通过任务奖励模型,根据机器人行为接近预期目标程度,分析任务奖励反馈的重要性程度,根据状态相关性动态调整任务奖励和视觉语言模型奖励之间的相对大小,进行视觉反馈和任务奖励平衡;多视角视频奖励结合分系统,结合多视角视频和任务奖励,在复杂的机器人运动任务中提供更精确的视觉反馈及学习效果。
技术关键词
多视角
视频
学习系统
视觉
分系统
评估机器人
子系统
运动技能学习
框架
反馈策略
文本
序列
体机器人
引导机器人
机制
超参数
数据
系统为您推荐了相关专利信息
风险评估方法
数据采集网络
深度学习神经网络
可读存储介质
无人机航测系统
输入控制系统
信号处理路径
显示装置
接口单元
主板模块
区控制系统
控制服务器
遥控灯具
隔离门
人脸识别摄像头
数据采集监控系统
智能监控分析
视频监控数据
数据采集模块
数据管理模块