具有复杂情感表现力的语音识别模型设计方法

正文

推荐专利

申请号：CN202410893063

申请日期：2024-07-04

公开号：CN118918881A

公开日期：2024-11-08

类型：发明专利

摘要

本发明涉及一种具有复杂情感表现力的语音识别模型设计方法，属于人工智能技术领域。利用表情符号表示语音体现的情感，将语音转化为对应的文字和一个符合其情感的表情符号。首先构建一个基于表情符号的具有复杂情感表现力的语音识别数据集；在此基础上，将语音的文字和情感识别作为一个整体，构建一个同时生成语音文字及其情感序列的模型，该模型以Conformer模块作为骨干模块，增加了特征提取模块和语音文本融合模块，并将表情符号的生成扩散到全部词汇的生成过程中，最后利用标签平滑正则化强化训练效果，具有参数量少、能表示语音复杂情感、准确率比现有语音识别和情感识别模型分别高了1%和3%左右等优点。

技术关键词

语音识别模型标签特征提取模块文本解码器前馈神经网络注意力样本情感识别模型生成特征生成方法数据编码器语义结构情感类别情感特征人工智能技术生成语音

系统为您推荐了相关专利信息

慢性病智能管理及轻诊断系统、家庭健康管理专家系统、交互方法、设备及介质

知识库管理交互方法健康档案管理图片家庭健康管理

大数据异常行为的风险检测方法、装置、设备及介质

风险检测方法输入神经网络模型环境传感器数据计算机可读指令图谱

一种基于生成式文本提示的脑电文本跨模态脑意图解码方法

解码模型自然语言文本意图解码方法代表

一种航班变化动态识别方法

预训练语言模型动态识别方法航空公司数据文本

一种支持动态数据及密钥更新的受控密文检索方法

密文检索方法密钥令牌云服务器可搜索加密技术

具有复杂情感表现力的语音识别模型设计方法

站点导航

APP 下载