基于对比学习的控制策略确定方法、装置、设备及介质

正文

推荐专利

申请号：CN202510872079

申请日期：2025-06-26

公开号：CN120848178A

公开日期：2025-10-28

类型：发明专利

摘要

本申请公开了一种基于对比学习的控制策略确定方法、装置、设备及介质。通过训练轨迹编码器将机械臂执行复杂任务的轨迹片段映射为嵌入向量，并基于预先构建的机械臂任务特性的对比损失函数来优化轨迹嵌入空间，利用轨迹片段对在嵌入空间中的距离来量化其区分度，优先选择区分度高的机械臂轨迹对，从而解决了离线PbRL中歧义查询导致的标注低效问题，并且能够减少人力成本、提升标注准确率；进而，学习到更准确的奖励模型，最终训练出性能更优的策略，通过对比学习与机械臂任务特性的深度融合提升机械臂控制性能。

技术关键词

轨迹控制策略计算机程序指令编码器机械臂解码器强化学习算法数据四边形计算机程序产品标签电子设备模块可读存储介质提升机械离线处理器重构运动

系统为您推荐了相关专利信息

端拾器、端拾器组件及工业机器人

滑动件端拾器滑移组件旋转盘抓取件

一种低速电动车电池充电监测控制方法及系统

充电控制策略监测控制系统电流电池状态监测模块电池状态数据

碱性聚合物电解质新颖结构生成及性能预测一体化智能系统

聚合物电解质一体化智能系统新颖结构碱性性能预测模型

一种瓶罐上下料机械臂

导向螺杆瓶罐双轴电机旋转电机导向块

基于工业大模型的智能控制系统及方法

搬运机器人现场状况智能控制系统智能控制方法时间段

基于对比学习的控制策略确定方法、装置、设备及介质

站点导航

APP 下载