一种基于视觉-语言大模型的操作员意图识别方法

AITNT
正文
推荐专利
一种基于视觉-语言大模型的操作员意图识别方法
申请号:CN202510852677
申请日期:2025-06-24
公开号:CN120850197A
公开日期:2025-10-28
类型:发明专利
摘要
本发明提出了一种基于视觉‑语言大模型的操作员意图识别方法,通过根据目标装配对象、操作需求及步骤、环境信息、协作要求、自然表达习惯与零件特征构建标准化提示词模板,结合操作员采集任务指令信息进行任务链路推理生成任务执行步骤与装配区域视觉信息,基于物体可供性检测技术结合实时传感器融合与环境感知生成动态协作数据,进而生成零部件操控信息与机器人协作指令作为动态操纵信息,结合操作员骨骼信息与外观纹理特征,通过门控机制融合多源感知数据实现特征加权融合,得到操作员意图,加强人类行为与装配任务之间的内在相关性,抑制无关信息干扰,实现准确的操作员意图识别,提升人机协作效率,具有重要的理论意义和实际价值。
技术关键词
意图识别方法 机器人协作 动态协作 特征加权融合 传感器融合 协作策略 纹理特征 零件特征 融合多源 视觉感知系统 骨骼关键点 语义 骨架特征 指令 机制 人机协作 模板
系统为您推荐了相关专利信息
1
低空飞行平台辅助的城市应急管理救援方法
任务调度 救援方法 飞行平台 机器学习模型 冗余控制策略
2
一种架桥信息智能化管理系统
智能化管理系统 数据采集层 区块链存证技术 多传感器融合技术 协同管理模块
3
一种驾驶员行为意图识别系统的构建方法及识别方法
意图识别系统 驾驶意图识别 数据 训练集 聚类
4
一种基于动态监测数据的边坡稳定性分析方法及系统
动态监测数据 风险预测模型 孔隙水压力 边坡稳定性监测 声发射
5
一种基于多传感器融合的门窗表面处理智能调控系统及方法
智能调控系统 多传感器融合 门窗 人机交互模块 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号