摘要
本发明涉及人工智能技术领域,本方案可应用于金融、医疗领域,本发明提供一种基于在线强化学习优化的流匹配图像生成方法及装置,方法包括:借助流匹配图像生成模型将输入的提示词转化为多个初始噪声;在流匹配图像生成模型中,基于SDE采样策略,结合预定义的策略参数按照预设的第一采样时间步对多个初始噪声进行逐步去噪,生成多个候选图像;通过标准差归一化获取每个候选图像对应的优势值;引入GRPO强化学习机制,基于每个候选图像对应的优势值对策略参数进行优化,得到优化后策略参数;基于优化后策略参数,通过流匹配图像生成模型生成与提示词相对应的高质量图像。本发明提升了组合图像生成与文字渲染任务的准确率,缩短训练时间。
技术关键词
图像生成模型
图像生成方法
策略
参数
噪声
在线
图像生成装置
机制
处理器
人工智能技术
可读存储介质
存储器
电子设备
程序
指令
金融
计算机
算法
系统为您推荐了相关专利信息
数控加工过程
刀具
数字孪生模型
路径优化方法
机床控制技术
日志生成方法
随机森林模型
进程
生成统计数据
可读存储介质
下行信道状态信息
多输入多输出系统
多输入多输出通信系统
信道状态信息反馈方法
解码器
配电网信息物理系统
双层优化模型
配电网调度员
混合整数线性规划
配电网拓扑模型
电压互感器
故障诊断模型
电气故障诊断
特征提取单元
时域特征