一种基于视觉-语言大模型的操作员意图识别方法

AITNT
正文
推荐专利
一种基于视觉-语言大模型的操作员意图识别方法
申请号:CN202510852677
申请日期:2025-06-24
公开号:CN120850197A
公开日期:2025-10-28
类型:发明专利
摘要
本发明提出了一种基于视觉‑语言大模型的操作员意图识别方法,通过根据目标装配对象、操作需求及步骤、环境信息、协作要求、自然表达习惯与零件特征构建标准化提示词模板,结合操作员采集任务指令信息进行任务链路推理生成任务执行步骤与装配区域视觉信息,基于物体可供性检测技术结合实时传感器融合与环境感知生成动态协作数据,进而生成零部件操控信息与机器人协作指令作为动态操纵信息,结合操作员骨骼信息与外观纹理特征,通过门控机制融合多源感知数据实现特征加权融合,得到操作员意图,加强人类行为与装配任务之间的内在相关性,抑制无关信息干扰,实现准确的操作员意图识别,提升人机协作效率,具有重要的理论意义和实际价值。
技术关键词
意图识别方法 机器人协作 动态协作 特征加权融合 传感器融合 协作策略 纹理特征 零件特征 融合多源 视觉感知系统 骨骼关键点 语义 骨架特征 指令 机制 人机协作 模板
系统为您推荐了相关专利信息
1
一种面向肥胖患者的运动检测与反馈干预系统
面向肥胖患者 反馈干预系统 运动检测 数据采集模块 模拟运动场景
2
一种多功能AI机器人
AI机器人 智能家居控制模块 机器人本体 可拆卸电池组 语音交互模块
3
一种多模态融合的疲劳监屏识别与提醒方法及系统
提醒方法 动态决策树 多模态数据融合 疲劳状态判定 特征加权融合
4
一种自主导航与实时监测集成的巡检机器人系统
巡检机器人系统 自主导航系统 多传感器融合 视觉摄像头 超声波传感器
5
一种基于多模态的敏感词和意图识别方法、装置及介质
敏感词检测模型 多模态特征 意图识别方法 逻辑分析 循环神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号