基于强化学习的模型优化方法、装置和电子设备

正文

推荐专利

申请号：CN202511366392

申请日期：2025-09-24

公开号：CN120893600A

公开日期：2025-11-04

类型：发明专利

摘要

本申请实施例提供一种基于强化学习的模型优化方法、装置和电子设备，涉及人工智能技术领域，基于强化学习的模型优化方法包括：获取携带有标签信息的第一样本数据；所述标签信息包括所述第一样本数据的参考结构信息，参考结构信息用于表示第一样本数据对应的参考结构化元素的位置信息；将第一样本数据输入预先训练的生成模型，对第一样本数据进行预测，得到第一样本数据的预测结构信息；根据预测结构信息和参考结构信息，确定生成模型的目标奖励，并基于目标奖励对生成模型进行优化。本申请实施例使生成模型在不依赖于复杂的后处理模块的情况下，能够获得高质量的结构化输出数据，提升模型优化的泛化性和灵活性。

技术关键词

模型优化方法样本数据标签格式元素坐标点后处理模块电子设备可读存储介质人工智能技术优化装置处理器存储器计算机

系统为您推荐了相关专利信息

基于GIS和Python的小流域设计洪水计算参数批量提取方法

分区批量水文数据处理技术栅格空间采样方法

基于双向协同扫描的大型异质构件CT成像方法及装置

射线源图像重建 CT成像方法重建技术电池包

一种雷达压缩感知方法、装置、介质、电子设备及系统

压缩感知方法压缩感知数据雷达存储单元压缩单元

一种基于合同要素的自动化匹配与调整方法

模板字段数据签署系统电子合同技术

一种考虑多状态特征的非侵入式工业负荷识别方法与系统

负荷识别方法 mRMR算法多状态事件检测算法 SVM算法

基于强化学习的模型优化方法、装置和电子设备

站点导航

APP 下载