基于上下文信息的语音情感识别方法、装置、设备及介质

正文

推荐专利

申请号：CN202510793541

申请日期：2025-06-13

公开号：CN120636474A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技、医疗健康等业务场景中，公开了一种基于上下文信息的语音情感识别方法、装置、设备及介质，包括：接收原始语音流并生成独立语音片段，识别文本并确定说话人角色类型，提取声学特征指标，生成初步情绪标签，结合历史对话文本生成上下文信息，将上下文信息、初步情绪标签、说话人角色类型及声学特征指标输入多模态融合模块，生成情感判定结果。本发明通过结合语音、文本及角色信息，并基于上下文信息实现多模态融合，能够在复杂对话场景下准确识别和理解各角色的情绪变化，避免了传统方法中单句情感判断误差大、忽视上下文信息的问题，有效提升情感识别的准确性和稳定性。

技术关键词

语音情感识别方法声学特征语音情感识别模型语义分析模型文本指标语音情感识别装置自动语音识别多模态情感识别标签置信度阈值生成语音多模态特征上下文特征标记客服情感特征

系统为您推荐了相关专利信息

基于知识图谱的重特大森林火灾应急救援通道路径构建方法

应急救援通道路径构建方法火灾风险预测模型图谱

一种基于多模态AI大模型的供热系统管网异常检测方法

供热系统管网异常事件异常检测方法大语言模型数据

基于多模态和差异增强的胆管癌淋巴结钙化点检测方法

钙化点检测方法胆管癌多模态实时检测系统超声图像数据

呼叫至救治时间优化方法与指导系统

时间优化方法优化指导系统行车路线规划救护车辆深度强化学习算法

对话任务执行方法、装置、电子设备及非易失性存储介质

专业答案非易失性存储介质文本联合损失函数

基于上下文信息的语音情感识别方法、装置、设备及介质

站点导航

APP 下载