基于强化学习的模型优化方法、装置和电子设备

AITNT
正文
推荐专利
基于强化学习的模型优化方法、装置和电子设备
申请号:CN202511366392
申请日期:2025-09-24
公开号:CN120893600A
公开日期:2025-11-04
类型:发明专利
摘要
本申请实施例提供一种基于强化学习的模型优化方法、装置和电子设备,涉及人工智能技术领域,基于强化学习的模型优化方法包括:获取携带有标签信息的第一样本数据;所述标签信息包括所述第一样本数据的参考结构信息,参考结构信息用于表示第一样本数据对应的参考结构化元素的位置信息;将第一样本数据输入预先训练的生成模型,对第一样本数据进行预测,得到第一样本数据的预测结构信息;根据预测结构信息和参考结构信息,确定生成模型的目标奖励,并基于目标奖励对生成模型进行优化。本申请实施例使生成模型在不依赖于复杂的后处理模块的情况下,能够获得高质量的结构化输出数据,提升模型优化的泛化性和灵活性。
技术关键词
模型优化方法 样本 数据 标签 格式 元素 坐标点 后处理模块 电子设备 可读存储介质 人工智能技术 优化装置 处理器 存储器 计算机
系统为您推荐了相关专利信息
1
基于GIS和Python的小流域设计洪水计算参数批量提取方法
分区 批量 水文数据处理技术 栅格 空间采样方法
2
基于双向协同扫描的大型异质构件CT成像方法及装置
射线源 图像重建 CT成像方法 重建技术 电池包
3
一种雷达压缩感知方法、装置、介质、电子设备及系统
压缩感知方法 压缩感知数据 雷达 存储单元 压缩单元
4
一种基于合同要素的自动化匹配与调整方法
模板 字段 数据 签署系统 电子合同技术
5
一种考虑多状态特征的非侵入式工业负荷识别方法与系统
负荷识别方法 mRMR算法 多状态 事件检测算法 SVM算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号