基于图文多模态的人物形象丑化检测方法

AITNT
正文
推荐专利
基于图文多模态的人物形象丑化检测方法
申请号:CN202510758545
申请日期:2025-06-09
公开号:CN120279397A
公开日期:2025-07-08
类型:发明专利
摘要
本发明涉及一种基于图文多模态的人物形象丑化检测方法,适用于图像检测识别技术领域。该方法将待检测图文输入经训练的丑化判别器,得到待检测图文的人物形象丑化检测结果;所述丑化判别器,包括:图像侧模型,用于提取图文中图像的图像语义特征;文本OCR特征提取器,用于识别图像中的文本,并提取文本的文本语义特征;文本侧模型,用于提取图文中文本的文本向量特征;丑化判别网络,用于基于多源融合特征,输出人物形象丑化检测结果,其中多源融合特征基于图像侧模型提取的图像语义特征和文本OCR特征提取器提取的文本语义特征形成。本发明实现对人物形象丑化结果做出高精度判断的同时,能够识别出丑化的具体内容描述。
技术关键词
图文 语义特征 多模态 文本 图像 特征提取器 多源融合 预训练模型 检测识别技术 人脸检测方法 多分支 样本 编码器 数据分布 处理器 检测设备 存储器 参数
系统为您推荐了相关专利信息
1
基于卷积神经网络的机器人图像识别系统
图像识别系统 去模糊图像 动态 机器人 模糊核估计
2
一种数据建模交互方法、装置及计算机可读存储介质
自然语言 智能问答系统 数据建模工具 交互方法 意图
3
一种风电场的风机缺陷试验检测方法
风电场风机 综合性 设备运行检测 检测点 指数
4
多模式自动跟随避障轮椅控制方法、装置、设备及介质
轮椅控制方法 关键点 踝关节角度 DWA算法 人行道
5
一种智能类案推荐方法及系统
类案推荐方法 基准标签 标签类别 案件 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号