一种基于多模态融合的智能语言学习方法

AITNT
正文
推荐专利
一种基于多模态融合的智能语言学习方法
申请号:CN202511253941
申请日期:2025-09-03
公开号:CN121034288A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于多模态融合的智能语言学习方法,属于智能语言学习领域。包括以下步骤:获取用户的语音输入信号、唇形视频数据和文本输入数据;对所述语音输入信号进行分帧加窗处理,得到语音特征向量;对所述唇形视频数据进行提取唇形运动特征向量;将所述文本输入数据提取文本语义特征向量;将所述语音特征向量、唇形运动特征向量和文本语义特征向量输入多模态对齐模块,获得对齐后的多模态特征表示;基于所述对齐后的多模态特征表示,通过条件生成模型动态生成个性化的语言学习内容;根据用户对所述语言学习内容的响应,生成多模态反馈信息。本发明采用多模态注意力对齐机制,可以提升学习效率,提高记忆保持率。
技术关键词
语言学习内容 智能语言学习方法 模态特征 梅尔频率倒谱系数 短时傅里叶变换 文本 对齐模块 三维卷积神经网络 人脸检测定位 语音 跨模态 语言学习系统 多模态数据采集 多模态注意力 预训练语言模型 多头注意力机制 蒸馏
系统为您推荐了相关专利信息
1
一种基于深度学习的主氦风机故障诊断系统及方法
风机故障诊断系统 子模块 风机故障诊断方法 深度学习模型 主氦风机
2
基于随钻声波前视的近钻头地层探测方法
地层探测方法 不良地质体 集合经验模态分解 震源 断层破碎带
3
一种基于文本、语音和表情动作的多模态情感识别算法
识别算法 文本 情感识别模型 情感特征 word2vec模型
4
面向语音交互的多智能体任务协同处理系统及处理方法
意图类别 语音输入模块 编码器单元 多任务损失函数 深度神经网络模型
5
不平衡跨领域的多模态分类方法、装置、设备及介质
分类方法 融合特征 跨模态 视觉特征 多模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号