一种基于扩散增强和多粒度特征融合的语音情感识别方法

AITNT
正文
推荐专利
一种基于扩散增强和多粒度特征融合的语音情感识别方法
申请号:CN202411820247
申请日期:2024-12-11
公开号:CN119296588B
公开日期:2025-03-11
类型:发明专利
摘要
本发明属于情感计算技术领域,具体涉及一种基于扩散增强和多粒度特征融合的语音情感识别方法,该方法将音频转换为梅尔频谱图;将梅尔频谱图输入扩散模型中,再逐步进行正向扩散注入噪声和反向扩散去除噪声,以恢复出更加清晰的音频;提取增强后音频的特征,然后从音频中提取出帧级特征、段级特征和话语级特征,再进行自适应特征选择,通过权重位置依赖进行深层融合;将融合后的多粒度语音特征输入动态图卷积情感分类模型,生成情感状态识别结果。本发明可提供多分类语音情感识别和语音质量增强等服务,从而在交互中提供更加人性化的响应。
技术关键词
语音特征 语音情感识别方法 情感类别 情感分类模型 节点特征 音频 情感状态识别 情感计算技术 记忆 交叉注意力机制 网络 多头注意力机制 邻居 矩阵 描述符 消除方法 冗余
系统为您推荐了相关专利信息
1
一种基于多分支图神经网络的APT检测方法及系统
邻居 多分支 系统日志 融合置信度 语义
2
基于多模态人工智能的人才画像构建方法、装置、设备以及介质
人才画像 音频 文本 视频帧 距离信息
3
一种面向认知通信对抗系统的协同序贯干扰决策方法
干扰决策方法 对抗系统 深度Q神经网络 全局状态信息 团队
4
基于云服务的招聘信息的智能处理方法及平台
分数预测模型 问答模型 语义向量 知识图谱构建 行业词典
5
一种基于迁移学习的配电网量测数据超分辨率感知方法
超分辨率 训练样本数据 学习器 配电网拓扑 级联
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号