摘要
本申请提出一种动作执行优化方法、装置、设备及存储介质,包括:响应于任务描述信息,生成任务描述信息对应的动作序列,动作序列包括按照预定执行顺序排列的多个动作信息;按照预定执行顺序依次执行各动作信息分别对应的执行动作;在第一执行动作执行结束的情况下,若第一执行动作的执行结果满足预设调整条件,则调整第一执行动作,第一执行动作为各执行动作中的任一执行动作。本申请实施例通过基于各执行动作对应的执行结果调整各执行动作,提高了动作执行的准确性。
技术关键词
监督学习模型
特征提取模型
执行优化方法
动作特征
序列
环境状态信息
规划
生成动作
数据
处理器
参数
样本
优化装置
可读存储介质
存储器
电子设备
模块
指令
计算机
程序