基于多解码头的自回归图像生成方法及装置

AITNT
正文
推荐专利
基于多解码头的自回归图像生成方法及装置
申请号:CN202510713979
申请日期:2025-05-29
公开号:CN120599069A
公开日期:2025-09-05
类型:发明专利
摘要
本申请提供了一种基于多解码头的自回归图像生成方法及装置,该方法包括:在初始的自回归模型上增加若干个并行解码头;利用历史图像集作为训练样本集输入到若干个并行解码头进行训练,得到训练好的若干个并行解码头;将待识别图像输入到训练好的若干个并行解码头中,利用训练好的若干个并行解码头在模型推理过程中预测若干个视觉词元的位置,得到目标预测结果;基于目标预测结果,利用投机解码策略对若干个视觉词元进行解码操作,得到若干个视觉词元对应的目标自回归图像。本申请在保证自回归图像生成质量和多样性预训练模型的情况下,加速自回归文本生成图像,提高图像生成质量,减少自回归模型的训练资源消耗,降低计算成本。
技术关键词
图像生成方法 码头 视觉 训练样本集 计算机装置 文本生成图像 分词 图像生成装置 可读存储介质 预训练模型 策略 解码单元 处理器通信 指令 存储器 参数
系统为您推荐了相关专利信息
1
一种基于边缘计算的目标检测方法及系统
深度学习模型 图片 视频流解码 对象 后处理算法
2
一种基于投影映射与深度预测的高密度彩色点云生成方法
彩色点云 生成高密度 坐标系 像素 相机
3
一种鲜食葡萄采摘机器人的重叠葡萄簇实例分割及抓持定位方法
实例分割 采摘机器人 网络 鲜食葡萄 标签
4
虚拟目标识别方法、装置、电子设备及存储介质
风格 图像 索引 标签 识别方法
5
一种基于社会力模型的高效室内人员疏散模拟与优化方法
社会力模型 障碍物 心理 代表 表达式
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号