一种基于视觉-语言大模型的操作员意图识别方法

正文

推荐专利

申请号：CN202510852677

申请日期：2025-06-24

公开号：CN120850197A

公开日期：2025-10-28

类型：发明专利

摘要

本发明提出了一种基于视觉‑语言大模型的操作员意图识别方法，通过根据目标装配对象、操作需求及步骤、环境信息、协作要求、自然表达习惯与零件特征构建标准化提示词模板，结合操作员采集任务指令信息进行任务链路推理生成任务执行步骤与装配区域视觉信息，基于物体可供性检测技术结合实时传感器融合与环境感知生成动态协作数据，进而生成零部件操控信息与机器人协作指令作为动态操纵信息，结合操作员骨骼信息与外观纹理特征，通过门控机制融合多源感知数据实现特征加权融合，得到操作员意图，加强人类行为与装配任务之间的内在相关性，抑制无关信息干扰，实现准确的操作员意图识别，提升人机协作效率，具有重要的理论意义和实际价值。

技术关键词

意图识别方法机器人协作动态协作特征加权融合传感器融合协作策略纹理特征零件特征融合多源视觉感知系统骨骼关键点语义骨架特征指令机制人机协作模板

系统为您推荐了相关专利信息

低空飞行平台辅助的城市应急管理救援方法

任务调度救援方法飞行平台机器学习模型冗余控制策略

一种架桥信息智能化管理系统

智能化管理系统数据采集层区块链存证技术多传感器融合技术协同管理模块

一种驾驶员行为意图识别系统的构建方法及识别方法

意图识别系统驾驶意图识别数据训练集聚类

一种基于动态监测数据的边坡稳定性分析方法及系统

动态监测数据风险预测模型孔隙水压力边坡稳定性监测声发射

一种基于多传感器融合的门窗表面处理智能调控系统及方法

智能调控系统多传感器融合门窗人机交互模块多模态

一种基于视觉-语言大模型的操作员意图识别方法

站点导航

APP 下载