一种开放词汇检测方法及装置

AITNT
正文
推荐专利
一种开放词汇检测方法及装置
申请号:CN202510368940
申请日期:2025-03-26
公开号:CN120411723A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种开放词汇检测方法及装置,其中该方法包括:获取待检测的自然语言提示及输入图像;通过预先训练的特征融合模型对自然语言提示和输入图像进行视觉语言联合建模,得到物体名称集合;特征融合模型是对基于历史图像及历史问题进行特征融合处理得到视觉语言特征,并根据视觉语言特征进行迭代训练得到的;通过预先训练的开放词汇检测模型基于输入图像和物体名称集合对输入图像中的目标物体进行检测,得到检测结果;开放词汇检测模型是对历史图像进行定位得到预测边界框,并基于视觉语言特征及预测边界框进行迭代训练得到的。本发明能够解决传统目标检测方法对固定类别集的依赖,以实现对图像中未知类别物体的准确检测和定位。
技术关键词
视觉特征 词汇检测方法 自然语言 物体 预测类别 大语言模型 计算机程序产品 生成图像特征 注意力机制 预测误差 答案 跨模态 图像块 标签 数据采集模块 处理器 检测探头
系统为您推荐了相关专利信息
1
基于知识图谱的系统自我监控修复方法及系统
自动化测试脚本 修复方法 监控修复系统 机器学习分类 知识图谱构建
2
查询处理方法、装置及电子设备
意图 查询处理方法 输出模块 查询处理装置 消息
3
数字孪生场景构建方法、设备、存储介质和程序产品
场景构建方法 数字孪生 图像 物理 对象
4
基于自然语言引导的场景自适应视频压缩方法及系统
视频压缩方法 自然语言 场景 二进制算术编码 语义特征
5
一种中药疗效智能分析与预测平台
靶标 中药方剂 智能管理平台 中医药 关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号