目标检测方法、装置、设备、存储介质和计算机程序产品

AITNT
正文
推荐专利
目标检测方法、装置、设备、存储介质和计算机程序产品
申请号:CN202411443367
申请日期:2024-10-16
公开号:CN119445205A
公开日期:2025-02-14
类型:发明专利
摘要
本发明提供一种目标检测方法、装置、设备、存储介质和计算机程序产品,涉及人工智能技术领域,该方法包括:获取待检测文本和待检测图像;将待检测文本和待检测图像输入开集目标检测模型,得到开集目标检测模型输出的检测结果;其中,开集目标检测模型包括图像信息与文本信息的混合模块,混合模块包括多层多头自注意力机制和多层基于类别引导的多头交叉注意力机制,混合模块用于对第一图像类别特征向量与待检测文本的文本特征进行增强,得到第一强化文本特征。本发明通过在开集目标检测模型中引入混合模块,将图像类别特征向量与文本特征相结合,使文本特征带有图像语义信息,从而减少语义歧义带来的影响,提高模型的零样本和少样本推理能力。
技术关键词
图像类别 混合模块 文本 交叉注意力机制 标签类别 计算机程序产品 非暂态计算机可读存储介质 图像编码 编码模块 处理器 坐标 样本 人工智能技术 数据 语义 列表
系统为您推荐了相关专利信息
1
基于检索增强生成技术的施工方案对比审查方法及系统
语义向量 文本 生成技术 命名实体识别 数据
2
基于领域知识图谱的铁路行车设备故障诊断方法及设备
行车设备 三元组 故障诊断方法 铁路 实体
3
基于大语言模型的可控多跳问题生成方法、系统及设备
大语言模型 实体 生成方法 组合型 三元组
4
基于LSTM长短期记忆模型的大模型联系上下文对话方法
LSTM模型 长短期记忆模型 对话系统 对话方法 序列
5
面向短视频平台的多模态事件信息传播策略识别方法及系统
策略 面部关键点 图像 短视频 识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号