具有复杂情感表现力的语音识别模型设计方法

AITNT
正文
推荐专利
具有复杂情感表现力的语音识别模型设计方法
申请号:CN202410893063
申请日期:2024-07-04
公开号:CN118918881A
公开日期:2024-11-08
类型:发明专利
摘要
本发明涉及一种具有复杂情感表现力的语音识别模型设计方法,属于人工智能技术领域。利用表情符号表示语音体现的情感,将语音转化为对应的文字和一个符合其情感的表情符号。首先构建一个基于表情符号的具有复杂情感表现力的语音识别数据集;在此基础上,将语音的文字和情感识别作为一个整体,构建一个同时生成语音文字及其情感序列的模型,该模型以Conformer模块作为骨干模块,增加了特征提取模块和语音文本融合模块,并将表情符号的生成扩散到全部词汇的生成过程中,最后利用标签平滑正则化强化训练效果,具有参数量少、能表示语音复杂情感、准确率比现有语音识别和情感识别模型分别高了1%和3%左右等优点。
技术关键词
语音识别模型 标签 特征提取模块 文本 解码器 前馈神经网络 注意力 样本 情感识别模型 生成特征 生成方法 数据 编码器 语义结构 情感类别 情感特征 人工智能技术 生成语音
系统为您推荐了相关专利信息
1
慢性病智能管理及轻诊断系统、家庭健康管理专家系统、交互方法、设备及介质
知识库管理 交互方法 健康档案管理 图片 家庭健康管理
2
大数据异常行为的风险检测方法、装置、设备及介质
风险检测方法 输入神经网络模型 环境传感器数据 计算机可读指令 图谱
3
一种基于生成式文本提示的脑电文本跨模态脑意图解码方法
解码模型 自然语言文本 意图 解码方法 代表
4
一种航班变化动态识别方法
预训练语言模型 动态识别方法 航空公司 数据 文本
5
一种支持动态数据及密钥更新的受控密文检索方法
密文检索方法 密钥 令牌 云服务器 可搜索加密技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号