基于文本调整与视觉反馈的针织产品图像生成方法及装置

正文

推荐专利

申请号：CN202510695629

申请日期：2025-05-28

公开号：CN120219553B

公开日期：2025-09-09

类型：发明专利

摘要

一种基于文本调整与视觉反馈的针织产品图像生成方法及装置，涉及计算机视觉领域，包括：构建对输入文本进行调节的语言模型；将接收到的用户输入的针织相关文本输入经训练的语言模型，获得对用户输入文本进行自适应调整后的文本；将自适应调整后的文本输入经训练的文生图模型，生成对应的图像；对自适应调整后的文本格式化为判断生成的图像与自适应调整后的文本是否吻合，将格式化文本和生成的图像输入大型视觉语言模型进行视觉问答，获得得分；若得分符合预期，输出针织产品图像；若得分不符合预期，最小化文本自注意力矩阵和交叉注意力相似性矩阵的距离优化潜在噪声变量，再次生成图像。本发明显著提升了针织产品图像的生成质量和用户体验。

技术关键词

注意力针织产品图像生成方法生成流文本编码器矩阵标记格式化噪声元素变量预训练语言模型图像生成装置网络策略计算机视觉

系统为您推荐了相关专利信息

一种面向农业气象灾害的零样本事件关系抽取方法

事件关系抽取方法面向农业同义词气象样本

一个新的草原SAR图像地物目标检测方法

SAR图像地物注意力机制网络模块抑制算法

封装半导体激光器的缺陷图像生成方法、装置及计算设备

封装半导体激光器引线变量查询特征风格

面向引导性话题网络的关键用户挖掘方法、装置及设备

话题 LDA主题模型挖掘方法兴趣意图

一种农业环境下的脐橙检测方法

脐橙采摘机器人训练集农业数据

基于文本调整与视觉反馈的针织产品图像生成方法及装置

站点导航

APP 下载