摘要
一种数据增强与混合专家机制特征选择的分类方法及系统,包括:自动语音识别(ASR)模块、文本到语音合成(TTS)模块、多模态特征提取模块、混合专家机制(MoE)模块、共注意力机制模块、特征融合模块和分类模块。本发明利用基于语音到文本(TTS)技术的语音数据增强模块,提升数据多样性和模型泛化能力;利用多层次的声学和文本特征的提取,更全面地表征语言的变化;利用混合专家机制(MoE)机制实现对多模态特征的动态选择,提高特征利用效率;利用共注意力机制优化不同模态特征之间的融合方式,增强特征间的交互表达能力,显著提升了在多模态环境下的识别精度与系统的鲁棒性,克服了上述不足。
技术关键词
MFCC特征
特征选择
注意力机制
模态特征
文本
自动语音识别
梅尔频率倒谱系数
多层次
分类系统
分类方法
模块
融合策略
采集单元
样本
音频信号预处理
网络
系统为您推荐了相关专利信息
智慧物业管理系统
支撑模块
计费管理
智能推荐算法
统一身份认证
主题分析方法
文本
预训练语言模型
节点特征
图像
图像风格迁移方法
跨模态
图像编码器
注意力
文本编码器