摘要
本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于视觉序列的规划方法、装置、设备及介质,包括:获取探索轨迹中形成的训练视觉状态序列,提取训练前缀视觉状态序列与训练后续视觉状态组成的视觉状态对,对生成式视觉模型进行初始训练;基于目标环境的前缀视觉状态序列生成多个候选后续视觉状态,解析获得离散动作并确定对应的环境反馈奖励值,进一步计算相对优势;基于相对优势更新生成式视觉模型参数,生成视觉规划序列。本发明通过在视觉状态空间中进行规划与反馈更新,避免图像转文本造成的信息损失,增强模型对空间结构和动态过程的建模能力,实现纯视觉驱动的动态规划,提升策略生成效果与环境适应性。
技术关键词
视觉
序列
规划
策略
轨迹
参数
计算机设备
人工智能技术
动态
医疗健康
度量
处理器
模块
空间结构
程序
比率
可读存储介质
存储器
金融
系统为您推荐了相关专利信息
强化学习算法
数据采集单元
二氧化碳浓度传感器
气候
控制单元
视觉检测方法
多级特征
语义特征提取
模态特征
交互注意力
图像识别构件
信息识别装置
传送机构
照明构件
图像采集器
健康状态评估方法
集成电源箱
历史回放时间
轨迹
回放模块