摘要
本发明涉及人工智能技术领域,公开了一种文本引导的图像细化方法,包括:获取包含文本描述和图像数据的训练数据集,标注图像中的特定区域,定义文本触发关键词,并将关键词与特定区域的标注信息建立映射关系;将更新后的训练数据集输入初步生成模型,识别关键词对应的特定区域,并调整生成模型的注意力分配机制,优化模型对特定区域的细节生成效果;基于优化后的生成模型生成包含细化结果的目标图像。本发明通过在训练阶段引入文本触发关键词并结合显著性区域的标注信息,增强模型对特定区域的识别和优化能力,实现了细化结果在生成过程中直接融入生成器,从而减少后处理步骤,能够有效提升复杂场景中特定区域的生成精度。
技术关键词
关键词
文本
图像
显著性检测模型
建立映射关系
数据
注意力
关键点特征
细化装置
纹理特征
特征识别模块
计算机设备
人工智能技术
定义
生成参数
处理器
程序
标识
可读存储介质
系统为您推荐了相关专利信息
细胞图像识别方法
语义分割模型
细胞图像识别装置
辅助检测方法
矫正
序列
监测方法
计算机可读指令
训练集
物流数据处理技术
自动识别方法
上下文语义理解
频谱特征
语音活动检测
声学特征