一种基于意图指令交互驱动的机器视觉方法

正文

推荐专利

一种基于意图指令交互驱动的机器视觉方法

申请号：CN202510209686

申请日期：2025-02-25

公开号：CN120163244A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公布了一种基于意图指令交互驱动的机器视觉方法。该方法使用意图文本指令数据集，训练文本编码器，使文本编码器能够将文本指令编码为视觉模型能够理解的特征；之后，使用带标签的图像数据集Mg和交叉熵损失预训练视觉模型E，使其能输出图像样本的概率分布Pg；最后，构造图像‑文本组合数据集O，使用区域‑文本比对损失和数据集O训练图像‑文本聚合模块，该模块用于接受意图解析模型传来的文本向量特征参数C，选用视觉模型Ea执行视觉任务。本发明引入了意图指令交互的方式，且使视觉模型在执行任务时专注于某类物体，而不是同时检测所有训练类别，相对于传统视觉算法的推理速度更快，占用资源更少，同时能保证视觉算法的检测精度。

技术关键词

意图指令机器视觉方法数据文本编码器视觉算法图像编码样本带标签精度模块语句物体标记

系统为您推荐了相关专利信息

低空设备数据处理方法、装置及非易失性存储介质

设备数据处理方法数据采集模板设备运行数据非易失性存储介质通信基站

基于多特征提取与融合的电力变压器温度预测方法及系统

温度预测方法电力变压器变量时序特征序列

一种工业零件装配位姿评估方法、设备、介质及产品

视觉特征模糊推理融合特征零件工业

基于深度残差网络的配电网故障恢复重构方法

深度残差网络模型配电网故障恢复重构方法历史运行数据配电网拓扑结构

一种基于物联网环境下吸尘器功率同步调节方法

吸尘器功率分配算法服务器环境监测数据控制终端

一种基于意图指令交互驱动的机器视觉方法

站点导航

APP 下载