一种基于图像检测自然语言描述目标的方法及电子设备

AITNT
正文
推荐专利
一种基于图像检测自然语言描述目标的方法及电子设备
申请号:CN202510469031
申请日期:2025-04-15
公开号:CN120032149B
公开日期:2025-07-11
类型:发明专利
摘要
本申请公开了一种基于图像检测自然语言描述目标的方法,包括:将待检测图像输入至已训练的用于将输入图像转换为具有图像详细描述数据并对图像详细描述数据中的文本实例进行定位描述的详细定位描述数据的专家模型,通过专家模型的推理,得到详细定位描述数据,详细定位描述数据包括:图像详细描述数据、以及与图像详细描述数据中的文本实例相对应的图像实例描述数据,利用待检测图像的详细定位描述数据,获取待检测图像中与文本实例所表征的自然语言描述目标相匹配的候选目标。本申请有利于提高自然语言所描述目标检测的准确性。
技术关键词
数据 图像 多模态 自然语言 样本 文本 大语言模型 代表 标签 电子设备 存储器 感兴趣 处理器
系统为您推荐了相关专利信息
1
针对多变量时序预测任务的数据拟合模型的实现方法、数据拟合模型、知识推理模型与数据拟合模型相结合的时序预测方法、系统及介质
数据拟合模型 时序预测方法 变量 融合特征 多头注意力机制
2
用于二分图像分割的高分辨率数据合成方法和设备
图像分割 编辑 生成器网络 边缘检测算子 生成方法
3
一种基于多视图时空融合的水面3D目标检测方法
图像嵌入 图像编码 注意力 图像块 相机设备
4
一种基于小波频域异构增强的遥感图像去雾网络的构建方法
遥感图像去雾 异构 有雾图像 高频特征 输出特征
5
基于位置编码的帧内跨分量色度预测
样本 亮度 融合特征 边界特征 坐标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号