基于多模态信息融合的操作控制方法、装置、设备及介质

正文

推荐专利

申请号：CN202510918112

申请日期：2025-07-03

公开号：CN120791752A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于具身智能、金融科技及医疗健康等业务场景中，公开了一种基于多模态信息融合的操作控制方法、装置、设备及介质，包括：获取操作环境的图像数据和任务指令，提取图像数据中的视觉特征以及任务指令中的语言特征，融合视觉特征与语言特征生成融合特征，将融合特征输入至动作生成模型生成动作序列，控制执行器根据动作序列在操作环境中执行操作，获取执行结果生成反馈信号，并基于反馈信号调整动作生成模型的参数。本发明通过融合视觉和语言特征，提升了操作控制系统对复杂环境变化的适应能力和多任务处理能力，从而能够实现更精确、更智能的操作控制，显著提高了系统的泛化能力和执行效率。

技术关键词

多模态信息融合操作控制方法生成反馈信号控制执行器末端执行器融合特征操作控制装置序列指令图像融合视觉特征参数编码特征数据异常事件关节模型更新视觉特征提取

基于多模态信息融合的操作控制方法、装置、设备及介质

站点导航

APP 下载