摘要
本发明提出了一种基于人工智能的沉浸式传统文化语言音频特征提取方法,涉及特征提取技术领域,具体步骤包括:构建结构化的传统文化语言音频数据集,提取对数Mel频谱图与频率相位谱图;计算频率相位残差信息并构建牵引因子矩阵,进行归一化处理;基于谱主应力、时间导向变化和谱交互耦合项构建谱应力激励张量,并结合牵引因子完成调制增强,生成多通道谱耦合张量;进一步利用非线性映射与扰动引导机制提取深度情绪特征,实现对多类别传统文化语言情绪的特征提取,有效提升传统文化语言音频特征表达的完整性。
技术关键词
音频特征提取方法
残差信息
残差矩阵
频率
数学模型
扰动结构
面向语音情感识别
短时傅里叶变换
因子
多通道
非线性
滑动窗口
特征提取模块
感知特征
应力
标签