目标检测方法、装置、设备、存储介质和计算机程序产品

正文

推荐专利

申请号：CN202411443367

申请日期：2024-10-16

公开号：CN119445205A

公开日期：2025-02-14

类型：发明专利

摘要

本发明提供一种目标检测方法、装置、设备、存储介质和计算机程序产品，涉及人工智能技术领域，该方法包括：获取待检测文本和待检测图像；将待检测文本和待检测图像输入开集目标检测模型，得到开集目标检测模型输出的检测结果；其中，开集目标检测模型包括图像信息与文本信息的混合模块，混合模块包括多层多头自注意力机制和多层基于类别引导的多头交叉注意力机制，混合模块用于对第一图像类别特征向量与待检测文本的文本特征进行增强，得到第一强化文本特征。本发明通过在开集目标检测模型中引入混合模块，将图像类别特征向量与文本特征相结合，使文本特征带有图像语义信息，从而减少语义歧义带来的影响，提高模型的零样本和少样本推理能力。

技术关键词

图像类别混合模块文本交叉注意力机制标签类别计算机程序产品非暂态计算机可读存储介质图像编码编码模块处理器坐标样本人工智能技术数据语义列表

系统为您推荐了相关专利信息

基于检索增强生成技术的施工方案对比审查方法及系统

语义向量文本生成技术命名实体识别数据

基于领域知识图谱的铁路行车设备故障诊断方法及设备

行车设备三元组故障诊断方法铁路实体

基于大语言模型的可控多跳问题生成方法、系统及设备

大语言模型实体生成方法组合型三元组

基于LSTM长短期记忆模型的大模型联系上下文对话方法

LSTM模型长短期记忆模型对话系统对话方法序列

面向短视频平台的多模态事件信息传播策略识别方法及系统

策略面部关键点图像短视频识别方法

目标检测方法、装置、设备、存储介质和计算机程序产品

站点导航

APP 下载