摘要
本发明属于机器学习领域,提供一种基于潜在空间扩散的模仿学习方法、系统及存储介质。本发明在扩散建模中引入了潜在空间扩散机制,有效减少了扩散模型在原始高维状态空间中运行所带来的计算负担,显著降低了训练时间与显存消耗,提升了训练的稳定性。同时,基于动量队列机制的对比学习网络,弥补了传统扩散模型只能捕捉分布层面信息、难以建立语义对应关系的缺陷。实现了时间维度上语义对齐的对比学习,同时保留了特征稳定性,有效抑制策略漂移所造成的学习不稳定问题。另一方面,本发明在训练策略过程中通过扩散路径与对比路径分别建模状态分布与行为语义特征,这种多通路、多尺度的学习机制能够表现出更高的一致性与稳定性。
技术关键词
模仿学习方法
噪声预测
轨迹
学习系统
参数
样本
队列机制
策略更新
投影模块
调度算法
语义特征
多通路
控制策略
网络结构
系统为您推荐了相关专利信息
客户
在线学习机制
推荐算法
时间序列预测模型
职业
设备控制方法
下位机
算法
设备控制技术
设备控制装置