一种基于领域Token的视觉任务生成方法

AITNT
正文
推荐专利
一种基于领域Token的视觉任务生成方法
申请号:CN202510746992
申请日期:2025-06-05
公开号:CN120655756A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及人工智能图像生成技术领域,具体为一种基于领域Token的视觉任务生成方法。包括:获取目标领域的领域特征信息并生成或确定至少一个领域词元;初始化一待生成图像的初始表示;在自回归生成过程中,根据先前已生成的图像部分对应的图像词元序列和所述至少一个领域词元,利用一个自回归模型预测当前位置的下一个图像词元;重复所述预测步骤直至生成代表完整图像的图像词元序列;以及基于所述代表完整图像的图像词元序列解码生成最终的像素空间图像。本发明通过引入和融合领域词元,能够更精确地控制生成图像的领域特有属性,显著提升特定领域图像的生成保真度和一致性,并提高对生成内容领域风格、元素和结构的可控性。
技术关键词
生成方法 视觉 图像解码器 序列 注意力机制 人工智能图像 解码模块 精确地控制 生成代表 生成技术 控制模块 随机噪声 生成系统 像素
系统为您推荐了相关专利信息
1
用于智能无人售卖柜的交互行为识别方法及系统
智能无人售卖柜 图像传感器 时间段 兴趣点 重力传感器
2
基于双通道光纤传感的精准同步的协同数据信号分析方法
分析方法 非线性噪声 传感 偏振态 通道
3
一种基于双目视觉与模糊评价的施工安全风险预警系统
风险预警系统 注意力 尺寸 Sigmoid函数 图像畸变校正
4
一种助产士远程监护系统及方法
胎心音信号 脉搏波传导时间 LSTM神经网络模型 小波阈值去噪算法 改进型动态
5
一种多路阀的仿真建模方法、装置及设备
多路阀 仿真建模方法 仿真模型 压力 注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号