基于多模态大模型的图像隐私定位识别方法及装置

AITNT
正文
推荐专利
基于多模态大模型的图像隐私定位识别方法及装置
申请号:CN202510348747
申请日期:2025-03-21
公开号:CN119863691B
公开日期:2025-06-06
类型:发明专利
摘要
本申请提供一种基于多模态大模型的图像隐私定位识别方法及装置,该方法包括:基于语义token获取初始查询特征,基于初始查询特征、局部视觉token序列和全局视觉token生成条件查询特征;基于融合特征和条件查询特征确定目标查询特征;将目标查询特征输入给多模态大模型得到预测位置和预测类别;若预测类别与隐私对象描述的相似度大于语义相似度阈值,确定待检测图像存在用户关注的隐私对象,对与预测位置匹配的内容进行脱敏;若相似度不大于语义相似度阈值,确定待检测图像存在用户不关注的隐私对象,对与预测位置匹配的内容不进行脱敏。通过本申请方案,能够有效识别图像中隐私信息。
技术关键词
查询特征 预测类别 视觉 融合特征 语义特征 对象 定位识别方法 序列 多模态 机器可读存储介质 词语 文本 图像块 上下文特征 定位识别装置 网络 特征值 注意力
系统为您推荐了相关专利信息
1
一种基于稀疏惯性传感器的人体运动捕获方法
人体运动捕获方法 惯性传感器 传感器特征 传感器编码器 文本编码器
2
插画提示语生成方法、装置、电子设备和存储介质
融合特征 交叉注意力机制 生成方法 电子设备 预训练模型
3
智能纸箱堆垛方法及系统
滑动时间窗口 智能纸箱 堆垛方法 轮廓特征 编码向量
4
图像处理方法、装置、介质、设备及产品
边缘结构信息 边缘检测模型 空间注意力模型 融合特征 图像处理方法
5
语音合成方法、装置、直播系统、电子设备及存储介质
音频编码 音色特征 大语言模型 文本 语音
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号