一种基于多模态理解的数字人交互方法及系统

正文

推荐专利

申请号：CN202411651766

申请日期：2024-11-19

公开号：CN119538967A

公开日期：2025-02-28

类型：发明专利

摘要

本发明涉及一种基于多模态理解的数字人交互方法及系统，属于数字人智能交互技术领域。其中，该方法包括：获取多模态数据，根据多模态数据通过特征提取模型得到多模态特征；根据多模态特征通过知识增强模型得到增强模态特征；根据增强模态特征通过图表示学习模型得到模态融合特征向量；大语言模型通过多头注意力机制学习模态融合特征向量得到自然语言输出。实现了数字人对于多模态数据的理解，提高了数字人交互过程中的平滑度、自然性和智能化。

技术关键词

人交互方法多模态特征特征提取模型多头注意力机制交互模型多模态注意力大语言模型计算机可执行指令邻居数据自然语言标签音频特征智能交互技术节点特征 BERT模型

系统为您推荐了相关专利信息

一种基于预训练语言模型的智能软件兼容性问题检测方法

预训练语言模型兼容性问题异常信息多头注意力机制软件

基于柔性可重构模型的低空无人机巡路智能监测方法

柔性可重构智能监测方法低空无人机多任务门控结构

数据补全方法、模型训练方法、存储介质及程序产品

数据补全方法模型训练方法电池性能检测方法特征提取模型计算机执行指令

基于持续学习的开放词汇多任务图像分类方法

原始图像数据图像编码器图像分类方法文本编码器多任务

一种基于语义匹配的方案智能推荐方法

智能推荐方法语义文本字符分词

一种基于多模态理解的数字人交互方法及系统

站点导航

APP 下载