摘要
本发明涉及智能体学习技术领域,公开了涉及一种智能体决策优化方法、装置、设备、存储介质及产品,该方法包括:获取待决策任务以及待决策任务对应的多模态数据;基于待决策任务以及预先建立的自适应融合模型,将多模态数据进行多模态融合,获得多模态融合数据;自适应融合模型包含由若干融合策略构成的融合策略库;将待决策任务以及多模态融合数据输入智能体进行智能体决策,获得智能体决策结果;其中,智能体根据环境反馈以及与其他智能体的交互,动态调整学习策略和行为模式。本发明通过对多模态数据的深度挖掘和智能体之间高效的交互学习,显著提升了智能体的决策准确性。
技术关键词
决策优化方法
多模态
融合策略
数据
网络
梯度下降算法
可读存储介质
指令
计算机程序产品
存储器
处理器
计算机设备
动态
模式
模块
参数