摘要
本发明涉及人工智能图像生成技术领域,具体为一种基于领域Token的视觉任务生成方法。包括:获取目标领域的领域特征信息并生成或确定至少一个领域词元;初始化一待生成图像的初始表示;在自回归生成过程中,根据先前已生成的图像部分对应的图像词元序列和所述至少一个领域词元,利用一个自回归模型预测当前位置的下一个图像词元;重复所述预测步骤直至生成代表完整图像的图像词元序列;以及基于所述代表完整图像的图像词元序列解码生成最终的像素空间图像。本发明通过引入和融合领域词元,能够更精确地控制生成图像的领域特有属性,显著提升特定领域图像的生成保真度和一致性,并提高对生成内容领域风格、元素和结构的可控性。
技术关键词
生成方法
视觉
图像解码器
序列
注意力机制
人工智能图像
解码模块
精确地控制
生成代表
生成技术
控制模块
随机噪声
生成系统
像素
系统为您推荐了相关专利信息
智能无人售卖柜
图像传感器
时间段
兴趣点
重力传感器
风险预警系统
注意力
尺寸
Sigmoid函数
图像畸变校正
胎心音信号
脉搏波传导时间
LSTM神经网络模型
小波阈值去噪算法
改进型动态