摘要
本申请涉及人工智能技术领域,具体涉及一种目标检测方法、电子设备、可读介质及程序产品。该方法可以预先收集类别词汇,基于类别词汇得到对应的类别描述扩展信息,用于提取包括各个对象类别对应文本特征的语言原型,并基于类别词汇获取对应的参考图像,用于提取包括各个对象类别对应图像特征的视觉原型,从而可以将待检测图像中所提取的特征,分别与上述语言原型及视觉原型中包含的特征进行匹配,基于匹配结果得到待检测图像中对象的类别。如此,能够基于语言模态、视觉模态的丰富先验信息,对待检测图像中对象进行分类,实现复杂场景下对各类对象的高精度检测。
技术关键词
图像
分类器
对象
原型
训练样本数据
文本
电子设备上执行
视觉
大语言模型
人工智能技术
计算机程序产品
介质
指令
存储器
标签
系统为您推荐了相关专利信息
运动功能障碍评估
运动功能评估
多模态数据融合
深度神经网络
残差网络
模型预测控制算法
系统控制方法
状态空间模型
离散状态空间
空气源热泵压缩机
位置预测方法
接地点
图像编码器
车载定位装置
多模态
优先级调度算法
模糊聚类算法
管理系统
图像特征向量
参数