摘要
本发明涉及人工智能技术领域,可应用于智能体自主决策、金融科技及医疗健康等业务场景中,公开了一种基于动作表征增强的决策方法、装置、设备及介质,包括:获取视觉数据、语言指令和预设的离散动作单元集合,生成视觉特征和语言特征,与初始动作表征融合,形成初始表征集合。根据关联度阈值分析,聚合高关联度表征成不同的动作聚类,并通过重要性度量增强目标动作聚类,生成优化动作表征集合,最后输入决策单元生成最终动作决策。本发明通过动态聚焦和重要性度量优化动作表征,提升关键动作信息的权重,确保复杂任务环境中的精准决策,提高任务完成的准确性和效率。
技术关键词
决策方法
多模态特征融合
视觉特征
聚类
度量
特征融合网络
指令
注意力机制
语义特征
生成训练样本
计算机设备
数据
分析模块
分词
人工智能技术
生成动作
多层感知机