基于多模态信息的决策方法、装置、设备及介质

正文

推荐专利

申请号：CN202511060286

申请日期：2025-07-30

公开号：CN120952168A

公开日期：2025-11-14

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于智能体自主决策、金融科技及医疗健康等业务场景中，公开了一种基于多模态信息的决策方法、装置、设备及介质，包括：获取视觉数据、语言指令和动作历史数据并处理为视觉特征、语言特征和动作历史特征，融合这些特征生成预处理多模态特征，使用分层动作解码器生成动作序列特征，将动作序列特征映射为控制参数生成动作决策，采集环境反馈信息并基于其生成新的动作序列特征，更新动作决策。本发明通过多模态信息处理和分层动作解码，将视觉、语言及动作历史信息动态融合，结合环境反馈优化动作序列生成与决策更新，有效提升了复杂环境下动作决策的适应性与精确度，增强了模型对多变场景的响应能力。

技术关键词

多模态信息序列特征多模态特征视觉特征决策方法生成动作解码器分层规划多尺度池化多头注意力机制指令语义融合特征计算机设备数据动态

系统为您推荐了相关专利信息

一种考虑故障相关的数控机床多级维修策略优化方法

子系统维修策略优化方法综合故障率历史故障数据故障相关性分析

自动驾驶的性能评估方法、装置、电子设备及存储介质

虚拟驾驶场景性能评估方法特征提取模块虚拟场景数据多模态特征融合

一种层次化意图驱动的人形机器人人机交互系统及其方法

人形机器人人机交互方法人机交互系统生成机器人关键点

一种多模态智能机器人系统及交互方法

多模态智能机器人多模态信息融合多模态特征融合图像采集装置数据融合机制

基于语义识别的大模型的训练数据冗余剔除方法及系统

剔除方法数据冗余节点高维特征向量知识图谱构建

基于多模态信息的决策方法、装置、设备及介质

站点导航

APP 下载