摘要
本发明涉及人工智能技术领域,公开了一种基于语音大模型的情绪识别方法、装置、设备及介质,应用于医疗领域的病人情绪识别场景中,其中,方法包括:获取语音片段信息和语音片段信息对应的文本描述信息;将语音片段信息和文本描述信息进行特征编码和特征对齐,生成联合特征,通过联合特征对预训练语音大模型进行自监督训练,生成初始语音大模型;收集语音指令对,对将初始语音大模型进行模型微调得到微调后语音大模型;获取带有多样化情绪标签的语音信息,对微调后语音大模型的目标函数进行优化,生成目标情绪识别模型;获取待识别语音片段信息,并基于目标情绪识别模型进行情绪识别,得到情绪识别结果。本发明提高了情绪识别的准确性。
技术关键词
情绪识别方法
情绪识别模型
高维特征向量
文本
情绪识别装置
标签
语音编码器
可读存储介质
人工智能技术
梯度算法
对齐模块
参数
策略
处理器
计算机设备
识别模块
存储器
系统为您推荐了相关专利信息
学习辅助方法
自闭症儿童
文本
交互模型
学习辅助系统
编程
答题
知识点标签
推荐方法
sigmoid函数