基于文本调整与视觉反馈的针织产品图像生成方法及装置

AITNT
正文
推荐专利
基于文本调整与视觉反馈的针织产品图像生成方法及装置
申请号:CN202510695629
申请日期:2025-05-28
公开号:CN120219553B
公开日期:2025-09-09
类型:发明专利
摘要
一种基于文本调整与视觉反馈的针织产品图像生成方法及装置,涉及计算机视觉领域,包括:构建对输入文本进行调节的语言模型;将接收到的用户输入的针织相关文本输入经训练的语言模型,获得对用户输入文本进行自适应调整后的文本;将自适应调整后的文本输入经训练的文生图模型,生成对应的图像;对自适应调整后的文本格式化为判断生成的图像与自适应调整后的文本是否吻合,将格式化文本和生成的图像输入大型视觉语言模型进行视觉问答,获得得分;若得分符合预期,输出针织产品图像;若得分不符合预期,最小化文本自注意力矩阵和交叉注意力相似性矩阵的距离优化潜在噪声变量,再次生成图像。本发明显著提升了针织产品图像的生成质量和用户体验。
技术关键词
注意力 针织产品 图像生成方法 生成流 文本编码器 矩阵 标记 格式化 噪声 元素 变量 预训练语言模型 图像生成装置 网络 策略 计算机视觉
系统为您推荐了相关专利信息
1
一种面向农业气象灾害的零样本事件关系抽取方法
事件关系抽取方法 面向农业 同义词 气象 样本
2
一个新的草原SAR图像地物目标检测方法
SAR图像地物 注意力机制 网络 模块 抑制算法
3
封装半导体激光器的缺陷图像生成方法、装置及计算设备
封装半导体激光器 引线 变量 查询特征 风格
4
面向引导性话题网络的关键用户挖掘方法、装置及设备
话题 LDA主题模型 挖掘方法 兴趣 意图
5
一种农业环境下的脐橙检测方法
脐橙 采摘机器人 训练集 农业 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号