一种基于多模态融合的智能语言学习方法

正文

推荐专利

一种基于多模态融合的智能语言学习方法

申请号：CN202511253941

申请日期：2025-09-03

公开号：CN121034288A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于多模态融合的智能语言学习方法，属于智能语言学习领域。包括以下步骤：获取用户的语音输入信号、唇形视频数据和文本输入数据；对所述语音输入信号进行分帧加窗处理，得到语音特征向量；对所述唇形视频数据进行提取唇形运动特征向量；将所述文本输入数据提取文本语义特征向量；将所述语音特征向量、唇形运动特征向量和文本语义特征向量输入多模态对齐模块，获得对齐后的多模态特征表示；基于所述对齐后的多模态特征表示，通过条件生成模型动态生成个性化的语言学习内容；根据用户对所述语言学习内容的响应，生成多模态反馈信息。本发明采用多模态注意力对齐机制，可以提升学习效率，提高记忆保持率。

技术关键词

语言学习内容智能语言学习方法模态特征梅尔频率倒谱系数短时傅里叶变换文本对齐模块三维卷积神经网络人脸检测定位语音跨模态语言学习系统多模态数据采集多模态注意力预训练语言模型多头注意力机制蒸馏

系统为您推荐了相关专利信息

一种基于深度学习的主氦风机故障诊断系统及方法

风机故障诊断系统子模块风机故障诊断方法深度学习模型主氦风机

基于随钻声波前视的近钻头地层探测方法

地层探测方法不良地质体集合经验模态分解震源断层破碎带

一种基于文本、语音和表情动作的多模态情感识别算法

识别算法文本情感识别模型情感特征 word2vec模型

面向语音交互的多智能体任务协同处理系统及处理方法

意图类别语音输入模块编码器单元多任务损失函数深度神经网络模型

不平衡跨领域的多模态分类方法、装置、设备及介质

分类方法融合特征跨模态视觉特征多模态特征

一种基于多模态融合的智能语言学习方法

站点导航

APP 下载