摘要
本申请实施方式提供了机器人控制模型的优化方法及相关设备,具体包括:基于用户操作数据优化机器人控制模型;其中,所述用户操作数据至少包括用于表征用户行为模式的数据;基于优化后的机器人控制模型生成用于驱动机器人运动的动作;基于所述机器人被驱动执行所述动作的过程中检测到的用户反馈数据,优化所述机器人控制模型;其中,所述用户反馈数据至少包括针对所述机器人执行所述动作的用户评价。本申请实施方式可以提升机器人控制模型的个性化程度。
技术关键词
机器人控制
数据
计算机程序产品
强化学习策略
计算机设备
参数
动作策略
模式
示范性
处理器
信号
存储器
多媒体
正面
离线
决策
运动
链路
语音
系统为您推荐了相关专利信息
两阶段退化产品
剩余寿命预测方法
状态监测数据
滤波方法
退化模型
永久性故障识别方法
贝瑞隆模型
瞬时性故障
低电压穿越能力
光伏接入配电网
车辆异常聚集
车辆轨迹数据
识别方法
置信度阈值
时间序列预测模型