基于动态验证反馈的生成优化方法、装置、设备及介质

正文

推荐专利

申请号：CN202510862161

申请日期：2025-06-25

公开号：CN120745822A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技及医疗健康等业务场景中，公开了一种基于动态验证反馈的生成优化方法、装置、设备及介质，包括：预训练用于分析生成内容质量的验证网络；构建包含正交奖励分量的动态奖励空间；将动态奖励空间集成至生成式模型中形成实时验证回路，在多个处理层中注入验证信号；根据验证信号优化生成式模型的探索策略；基于实时验证回路与优化后的探索策略执行双回路反馈控制，动态调整训练参数，生成目标模型；基于目标模型输出推理结果。本发明通过构建实时验证回路与优化策略，实现双回路反馈控制机制，将验证信号引入训练过程，动态响应训练误差和策略偏差，结合快速与慢速调节路径，提升生成式模型训练效率。

技术关键词

中间层双回路策略信号动态权重分配误差控制网络优化装置控制执行模块参数计算机设备文本人工智能技术医疗健康处理器样本逻辑程序

系统为您推荐了相关专利信息

极端天气下基于半监督学习的跨域目标检测方法和系统

半监督学习训练检测模型天气标签学生

一种教育机器人语音信号处理方法

语音信号处理方法教育机器人识别置信度多通道学生

再生芯片、再生墨盒和图像形成装置

再生芯片逻辑监测单元再生墨盒墨盒芯片

一种输液滴速报警器

输液滴速报警器光电传感器控制器卡尔曼滤波算法协方差矩阵

通感一体化方法、感知模块、芯片、基站

基站模块一体化方法芯片消息

基于动态验证反馈的生成优化方法、装置、设备及介质

站点导航

APP 下载