文本引导的图像细化方法、装置、设备及介质

正文

推荐专利

申请号：CN202510342404

申请日期：2025-03-21

公开号：CN120198735A

公开日期：2025-06-24

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种文本引导的图像细化方法，包括：获取包含文本描述和图像数据的训练数据集，标注图像中的特定区域，定义文本触发关键词，并将关键词与特定区域的标注信息建立映射关系；将更新后的训练数据集输入初步生成模型，识别关键词对应的特定区域，并调整生成模型的注意力分配机制，优化模型对特定区域的细节生成效果；基于优化后的生成模型生成包含细化结果的目标图像。本发明通过在训练阶段引入文本触发关键词并结合显著性区域的标注信息，增强模型对特定区域的识别和优化能力，实现了细化结果在生成过程中直接融入生成器，从而减少后处理步骤，能够有效提升复杂场景中特定区域的生成精度。

技术关键词

关键词文本图像显著性检测模型建立映射关系数据注意力关键点特征细化装置纹理特征特征识别模块计算机设备人工智能技术定义生成参数处理器程序标识可读存储介质

系统为您推荐了相关专利信息

基于人脸识别的人员检测方法、装置、设备及存储介质

人脸特征值身份加密标识网络传输协议

一种宫颈癌细胞图像识别方法及装置

细胞图像识别方法语义分割模型细胞图像识别装置辅助检测方法矫正

物流货量监测方法、装置、设备及存储介质

序列监测方法计算机可读指令训练集物流数据处理技术

一种基于人工智能的黑广播语义自动识别系统及方法

自动识别方法上下文语义理解频谱特征语音活动检测声学特征

基于混合点和孪生线特征重投影联合优化的移动机器人位姿估计方法

线特征误差函数端点图像特征提取算法

文本引导的图像细化方法、装置、设备及介质

站点导航

APP 下载