文本引导的图像细化方法、装置、设备及介质

AITNT
正文
推荐专利
文本引导的图像细化方法、装置、设备及介质
申请号:CN202510342404
申请日期:2025-03-21
公开号:CN120198735A
公开日期:2025-06-24
类型:发明专利
摘要
本发明涉及人工智能技术领域,公开了一种文本引导的图像细化方法,包括:获取包含文本描述和图像数据的训练数据集,标注图像中的特定区域,定义文本触发关键词,并将关键词与特定区域的标注信息建立映射关系;将更新后的训练数据集输入初步生成模型,识别关键词对应的特定区域,并调整生成模型的注意力分配机制,优化模型对特定区域的细节生成效果;基于优化后的生成模型生成包含细化结果的目标图像。本发明通过在训练阶段引入文本触发关键词并结合显著性区域的标注信息,增强模型对特定区域的识别和优化能力,实现了细化结果在生成过程中直接融入生成器,从而减少后处理步骤,能够有效提升复杂场景中特定区域的生成精度。
技术关键词
关键词 文本 图像 显著性检测模型 建立映射关系 数据 注意力 关键点特征 细化装置 纹理特征 特征识别模块 计算机设备 人工智能技术 定义 生成参数 处理器 程序 标识 可读存储介质
系统为您推荐了相关专利信息
1
基于人脸识别的人员检测方法、装置、设备及存储介质
人脸特征值 身份 加密 标识 网络传输协议
2
一种宫颈癌细胞图像识别方法及装置
细胞图像识别方法 语义分割模型 细胞图像识别装置 辅助检测方法 矫正
3
物流货量监测方法、装置、设备及存储介质
序列 监测方法 计算机可读指令 训练集 物流数据处理技术
4
一种基于人工智能的黑广播语义自动识别系统及方法
自动识别方法 上下文语义理解 频谱特征 语音活动检测 声学特征
5
基于混合点和孪生线特征重投影联合优化的移动机器人位姿估计方法
线特征 误差函数 端点 图像 特征提取算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号