基于图文多模态的人物形象丑化检测方法

正文

推荐专利

基于图文多模态的人物形象丑化检测方法

申请号：CN202510758545

申请日期：2025-06-09

公开号：CN120279397A

公开日期：2025-07-08

类型：发明专利

摘要

本发明涉及一种基于图文多模态的人物形象丑化检测方法，适用于图像检测识别技术领域。该方法将待检测图文输入经训练的丑化判别器，得到待检测图文的人物形象丑化检测结果；所述丑化判别器，包括：图像侧模型，用于提取图文中图像的图像语义特征；文本OCR特征提取器，用于识别图像中的文本，并提取文本的文本语义特征；文本侧模型，用于提取图文中文本的文本向量特征；丑化判别网络，用于基于多源融合特征，输出人物形象丑化检测结果，其中多源融合特征基于图像侧模型提取的图像语义特征和文本OCR特征提取器提取的文本语义特征形成。本发明实现对人物形象丑化结果做出高精度判断的同时，能够识别出丑化的具体内容描述。

技术关键词

图文语义特征多模态文本图像特征提取器多源融合预训练模型检测识别技术人脸检测方法多分支样本编码器数据分布处理器检测设备存储器参数

系统为您推荐了相关专利信息

基于卷积神经网络的机器人图像识别系统

图像识别系统去模糊图像动态机器人模糊核估计

一种数据建模交互方法、装置及计算机可读存储介质

自然语言智能问答系统数据建模工具交互方法意图

一种风电场的风机缺陷试验检测方法

风电场风机综合性设备运行检测检测点指数

多模式自动跟随避障轮椅控制方法、装置、设备及介质

轮椅控制方法关键点踝关节角度 DWA算法人行道

一种智能类案推荐方法及系统

类案推荐方法基准标签标签类别案件文本

基于图文多模态的人物形象丑化检测方法

站点导航

APP 下载