摘要
本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种多模态动作模型的策略优化方法、装置、设备及介质,所述方法包括:对获取的图像数据、语言指令和目标用户的行为动作序列之间进行关系分析,得到关系依赖性,结合初始训练参数组构建初始多模态动作模型,利用获取的任务特定数据对初始多模态动作模型进行微调,得到微调多模态动作模型,获取目标环境的环境交互数据集,利用微调多模态动作模型对环境交互数据集进行逐个交互采样,生成若干个目标交互轨迹,并对微调多模态动作模型中的选择策略进行策略优化,得到目标选择策略。本发明提升了多模态动作模型在面对新情境或数据不足时,模型的选择策略准确度。
技术关键词
策略优化方法
多模态
轨迹
数据
参数
皮尔逊相关系数
关键帧
采样点
交互动作
序列
策略优化装置
指令
语义向量
图像
处理器
人工智能技术
医疗健康
强度
系统为您推荐了相关专利信息
无标签数据
医学影像分割方法
半监督训练
医学影像数据
分阶段
盾构隧道管片拼装
视觉检测方法
管片接缝处
激光点云数据
三维点云数据
车载报警装置
车载报警系统
高精度定位模块
高精度定位数据
车辆位置监测
车载诊断数据
数字高程模型数据
道路坡度数据
柴油车
分析方法
业务场景预测
项目管理方法
场景知识图谱
语义规则
实体关系数据