基于属性对比的密集场景多模态目标检测方法

AITNT
正文
推荐专利
基于属性对比的密集场景多模态目标检测方法
申请号:CN202511231827
申请日期:2025-09-01
公开号:CN120747845B
公开日期:2025-11-28
类型:发明专利
摘要
本发明涉及目标检测技术领域,公开了基于属性对比的密集场景多模态目标检测方法,包括:将图像和自然语言描述分别输入至预设的特征提取模型提取初始视觉特征和初始语言特征;根据预设的多个属性类型,将初始视觉特征和初始语言特征解耦为多个视觉属性级特征和对应的多个语言属性级特征;将多个视觉属性级特征和对应的多个语言属性级特征输入至细粒度属性对比模型,增大不同属性值对应的属性级特征间的区分度,得到增强的多模态属性特征;融合增强的多模态属性特征以生成最终特征谱,并输出自然语言描述所指定的目标对象在图像中的位置信息。本发明旨在解决现有技术在密集场景下因无法分辨相似目标而导致的检测性能不佳的问题。
技术关键词
视觉特征 多模态 自然语言 特征提取模型 双向长短期记忆网络 场景 特征金字塔网络 联合损失函数 图像 分支 检测器 对象 级联 坐标 编码
系统为您推荐了相关专利信息
1
一种基于两级大模型智能体的无人装备集群协同控制方法
协同控制方法 装备 集群 指令 模板
2
一种用于脑电-语音-文本三模态对齐方法及设备
文本 语音 多层感知器 对齐方法 特征匹配算法
3
基于多源异构定位数据融合算法的轨迹优化方法
轨迹优化方法 数据融合算法 误差补偿模型 权重分配策略 深度强化学习
4
一种智能客服会话分类方法及装置
关键词特征 司机 历史会话 意图 智能客服
5
基于非限定实体、跨阶段的核电经验反馈查找方法及系统
实体 查找方法 文本 计算机可读指令 阶段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号