基于人工智能的图像处理方法、装置、计算机设备及介质

正文

推荐专利

申请号：CN202510724258

申请日期：2025-05-30

公开号：CN120765490A

公开日期：2025-10-10

类型：发明专利

摘要

本申请属于人工智能技术领域，涉及一种基于人工智能的图像处理方法、装置、计算机设备及存储介质，包括：获取输入的文本描述与参考图像；基于层次化编码器对文本描述与参考图像进行特征提取，得到与文本描述对应的文本嵌入，以及与参考图像对应的姿态嵌入；基于层次化对齐模块对文本嵌入与姿态嵌入进行语义对齐处理得到对齐特征；基于跨模态适配器对对齐特征进行语义优化处理得到目标特征；基于姿态条件生成器执行与目标特征对应的图像生成处理得到目标图像；对目标图像进行输出处理。此外，本申请的目标图像可存储于区块链中。本申请可应用于金融领域和医疗领域中的文生图场景，实现了文本到图像的精确姿态控制，提高了生成的目标图像的质量。

技术关键词

图像处理方法对齐模块计算机可读指令语义交叉注意力机制适配器文本编码器计算机设备跨模态图像处理装置可读存储介质人工智能技术姿势噪声抑制关节策略处理器

基于人工智能的图像处理方法、装置、计算机设备及介质

站点导航

APP 下载