一种基于跨模态对齐的文本与人脸协同修复方法

正文

推荐专利

申请号：CN202511149392

申请日期：2025-08-18

公开号：CN120655787B

公开日期：2025-10-24

类型：发明专利

摘要

本发明适用于图像处理技术领域，提供了一种基于跨模态对齐的文本与人脸协同修复方法，包括以下步骤：构建文本‑人脸多模态数据集；基于跨模态网络架构，实现文本‑人脸多模态数据集中的图像超分辨率以及文本和图像对齐；训练跨模态网络，设计优化混合损失函数；推理生成高质量图像。本发明通过构建文本语义与图像特征的深度融合框架，显著提升了修复后人脸图像的身份特征保留能力，从而为人脸识别率的提升奠定了关键基础。

技术关键词

协同修复方法跨模态混合损失函数图像超分辨率人脸文本编码器生成高质量图像多模态网络架构图像编码器交叉注意力机制解码器面部结构人物特征图像处理技术数据语义

系统为您推荐了相关专利信息

资源转移方法、装置、设备、存储介质和程序产品

资源转移信息生物特征信息凭证资源转移方法资源转移管理

基于多模态大语言模型的工地安监智能体系统

智能体系统大语言模型安监工地视觉特征编码

一种基于对比学习的多模态医学图像交叉检索方法及系统

图像编码器文本编码器图像特征向量检索方法序列特征

一种用于艺术作品分析的多模态深度学习方法

深度学习方法多尺度特征金字塔图像高层语义特征跨模态

基于掩码指导信息融合的新闻场景多层级图文检索方法

图文检索方法层级跨模态文本编码器图像编码器

一种基于跨模态对齐的文本与人脸协同修复方法

站点导航

APP 下载