摘要
本发明涉及金融及医疗的语音处理技术领域,公开了语音模型训练方法、语言识别方法、装置、设备及介质,方法包括获取音频数据集,所述音频数据集包括多种情绪的语音样本,每个所述语音样本标注有对应的情绪类别;将每个语音样本输入至待训练模型,以按照预定义语法结构生成多个候选输出序列,所述预定义语法结构包括分析过程文本段和情绪分类结果段;对每个语音样本所对应的所有候选输出序列进行多维度奖励评估;根据多维度奖励评估结果更新待训练模型的策略参数;基于策略参数对待训练模型进行迭代更新,直至模型收敛,以得到训练后的目标模型,将该目标模型作为最终的语音模型。本发明提升了情绪识别的准确性以及增强了模型的可解释性。
技术关键词
语音模型训练方法
语法结构
语音识别方法
语言识别方法
序列
语音情绪识别
样本
标签
策略更新
文本
音频
语音识别装置
模型训练装置
参数
数据获取单元
处理器
格式
语义
系统为您推荐了相关专利信息
产前诊断方法
纳米孔
测序芯片
接头组合
DNA提取试剂盒
节点
分布式事务
级联
解析执行方法
路径优化算法