摘要
本发明属于目标检测与识别技术领域,具体涉及一种基于思维链的大小模型协同目标检测与识别方法。该发明,小模型负责大部分易检目标,减少大模型计算压力,大模型负责存疑样本,结合视觉与语言多模态推理,整体误检和漏检率均降低,通过联合概率进行置信度评估,实现对不确定结果的自动筛选与人工复核,保证关键结果的可靠性,“伪思维链+伪标签”方法,借助模型自身生成的推理与标签,减少了对人工标注的数据依赖,仅对低置信度样本进行人工确认,缩小人力介入范围,显著节省人力成本,短语级特征描述符的引入,为模型提供了更细粒度的语义信息,提升对复杂目标属性与状态的辨识能力。
技术关键词
识别方法
特征描述符
多模态
标签
坐标
输出序列长度
生成提示词
专用模型
模板
模块
图像
数据
识别系统
接口
文本
样本
人力
语义
视觉
系统为您推荐了相关专利信息
畸变参数
存储单元
摄像头内参
全景图像处理方法
畸变矫正算法
排气制动电磁阀
排气蝶阀
制动系统
多模态
发动机本体
医学图像分割模型
医学图像分割方法
解码器
前馈神经网络
梯度下降优化算法