摘要
本发明涉及人工智能技术领域,可应用于具身智能、金融科技及医疗健康等业务场景中,公开了一种任务执行策略生成与调整方法、装置、设备及介质,包括:获取环境中的视觉信息、音频信息和与任务相关的语言指令信息,对视觉信息、音频信息和语言指令信息进行编码,获得视觉特征、音频特征和语言特征,融合视觉特征、音频特征和语言特征生成综合特征,基于综合特征生成初始任务执行策略并执行对应动作,在执行过程中,根据环境的实时反馈信息,采用强化学习模型动态调整初始任务执行策略,得到更新后的任务执行策略。本发明通过多模态信息融合与强化学习动态调整,实现了复杂环境下任务执行策略的优化与灵活更新,提升了具身智能设备的自主决策能力。
技术关键词
音频特征
策略
强化学习模型
驱动执行装置
动态障碍物
指令
声学传感器阵列
多模态信息融合
融合视觉特征
语音接收装置
时域特征
频域特征
语义特征
规划
语义注意力
系统为您推荐了相关专利信息
融合特征
注意力
多尺度特征融合
多模态影像数据
图像
在线参数辨识
闭环建模方法
黑盒模型
闭环辨识模型
储能控制系统
优化设计方法
微纳结构
红外窗口
强化学习环境
反射率