摘要
本发明涉及一种基于图文多模态的人物形象丑化检测方法,适用于图像检测识别技术领域。该方法将待检测图文输入经训练的丑化判别器,得到待检测图文的人物形象丑化检测结果;所述丑化判别器,包括:图像侧模型,用于提取图文中图像的图像语义特征;文本OCR特征提取器,用于识别图像中的文本,并提取文本的文本语义特征;文本侧模型,用于提取图文中文本的文本向量特征;丑化判别网络,用于基于多源融合特征,输出人物形象丑化检测结果,其中多源融合特征基于图像侧模型提取的图像语义特征和文本OCR特征提取器提取的文本语义特征形成。本发明实现对人物形象丑化结果做出高精度判断的同时,能够识别出丑化的具体内容描述。
技术关键词
图文
语义特征
多模态
文本
图像
特征提取器
多源融合
预训练模型
检测识别技术
人脸检测方法
多分支
样本
编码器
数据分布
处理器
检测设备
存储器
参数
系统为您推荐了相关专利信息
图像识别系统
去模糊图像
动态
机器人
模糊核估计
自然语言
智能问答系统
数据建模工具
交互方法
意图
轮椅控制方法
关键点
踝关节角度
DWA算法
人行道