一种自适应多模态互补意图理解方法、系统及设备

正文

推荐专利

申请号：CN202510290457

申请日期：2025-03-12

公开号：CN120217294A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种自适应多模态互补意图理解方法、系统及设备，主要涉及多模态互补意图理解技术领域。包括以下步骤：实时获取人机交互过程中手势特征向量序列，并对手势特征向量序列进行处理；实时获取连续的音频流，并分割成基于语音中的停顿或固定的时间窗口；搭建实验环境，并从实验环境中获取实时图像作为其中模态之一；根据获取的手势模态、语音模态以及图像模态，构建知识图谱；针对语音模态和图像模态采用基于知识图谱的互补注意机制进行多模态意图融合提取；使用混合专家模型，进行多模态意图融合。本发明的有益效果在于：它提高了意图理解的准确性，还通过在机器人与其老年用户之间创建更直观、反应更迅速的交互流程，丰富了互动体验。

技术关键词

意图理解方法多模态构建知识图谱语音图像特征向量实时图像意图理解技术序列注意力机制矩阵知识图谱构建理解系统多层感知器手势特征

系统为您推荐了相关专利信息

用于五金冲压模具的智能打孔控制方法及系统

五金冲压模具智能打孔序列特征工程时序

一种基于统计分析的医药渠道内漏品漏量核查系统及方法

多模态传感器决策支持数据数据交互单元核查系统监控模块

基于光谱和视觉数据耦合的高粱糯性判别方法及装置

高粱判别方法视觉数据特征提取样本

基于多模态大模型的无人机视频摘要语义描述方法及系统

视频帧视频场景分割语义摘要多模态

基于大模型的多模态数据分析智能体及方法

数据分析算法多模态数据分析关系型数据库输出模块计算机执行指令

一种自适应多模态互补意图理解方法、系统及设备

站点导航

APP 下载