基于多模态大模型在人机协同环境中的意图理解方法

正文

推荐专利

申请号：CN202510289601

申请日期：2025-03-12

公开号：CN119785276B

公开日期：2025-05-09

类型：发明专利

摘要

本发明涉及人工智能技术领域，涉及一种基于多模态大模型在人机协同环境中的意图理解方法。其包括以下具体步骤：视频分析与任务规划；采用关键帧提取和图像分割方法对视频进行预处理；构建任务的有向无环图，记忆可行的任务路径；实时意图判断；对多模态数据进行处理，将不同模态的数据截取图片按照固定方式拼接在一起；使用任务有向无环图筛选大模型一次判断时需要面对的子任务，并且给大模型梳理一些更可能发生的子任务序列；机械臂指令生成与反馈；根据任务有向无环图发出相应的指令、执行相应步骤，生成反馈数据。本发明通过结合视觉、听觉等多模态信息，实时感知环境和任务执行过程，成功实现了对复杂环境中人物行为的精准识别与任务推断。

技术关键词

意图理解方法人机协同结点有向无环图多模态图像分割方法视频分析关键帧图片人工智能技术机械臂处理器物体数据指令标记序列

系统为您推荐了相关专利信息

基于PIV实验与CFD仿真的胆道流体多模态研究平台及方法

胆道系统微型注射泵多模态中央控制器激光产生器

一种多模态协同配送调度系统及方法

适应性算法无人配送技术资源分配资源集中管理交通状况变化趋势

基于煤场智能集控技术的配煤掺烧专家决策系统及方法

锅炉运行状态锅炉运行参数专家决策系统智能集控多模态

基于图神经网络的乳腺癌新辅助化疗疗效预测方法

乳腺癌新辅助化疗疗效神经网络模型患者时序化疗疗效预测

一种图像生成方法、装置、存储介质及电子设备

图像生成模型动态门控信息编码语义图像生成方法

基于多模态大模型在人机协同环境中的意图理解方法

站点导航

APP 下载