行为克隆模型训练方法、装置、设备及介质

正文

推荐专利

行为克隆模型训练方法、装置、设备及介质

申请号：CN202510974644

申请日期：2025-07-15

公开号：CN120580451A

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及智能决策技术领域，可应用于金融科技、医疗健康等业务系统平台中，公开了一种行为克隆模型训练方法、装置、设备及介质，包括：获取多模态输入，对多模态输入进行特征提取与拼接，得到输入表示；利用预设解码器提取输入表示的潜在表示，利用预设策略头将潜在表示解码为动作数据；利用信息瓶颈原理计算潜在表示的互信息损失函数值，计算动作数据与预设真实动作数据的均方误差损失值；根据互信息损失函数值和均方误差损失值对预设解码器和预设策略头的参数进行迭代更新，得到更新模型；实时检测更新模型中的联合损失函数值是否小于预设阈值；当联合损失函数值小于预设阈值时，停止参数迭代更新，得到优化模型。

技术关键词

模型训练方法联合损失函数多模态解码器误差编码策略智能决策技术深度特征提取模型训练装置梯度下降算法数据参数图像块瓶颈多层感知器可读存储介质变换器医疗健康

系统为您推荐了相关专利信息

智能交互方法、装置、设备、系统及存储介质

视频流多模态信息智能交互方法视频帧关键词

基于滚动优化与群智能算法的土石方动态再平衡方法

土石方堆石坝平衡方法群智能优化算法资源调度优化

基于快速Hanning自卷积窗S变换的电能质量扰动检测方法

频域特征电能矩阵幅值检测误差

一种腰椎保护方法、系统及介质

腰部支撑保护装置不良姿势腰椎保护方法支撑元件

一种考虑新能源不确定性的综合能源价格预测方法

热电联产机组电锅炉分布鲁棒综合能源系统发电机

行为克隆模型训练方法、装置、设备及介质

站点导航

APP 下载