一种在线辅助语音对话场景的多模态情感提示方法及系统

正文

推荐专利

申请号：CN202510073682

申请日期：2025-01-17

公开号：CN119479705B

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种在线辅助语音对话场景的多模态情感提示方法及系统，涉及人工智能技术领域，将语音对话场景中的语音信号输入到训练好的多模态情感提示大模型中，输出情感标签及语音情感提示信息；多模态情感提示大模型的训练过程如下：获取真实对话场景的原始语音数据以构建情感识别的训练数据集；对训练数据集中的原始语音数据进行特征提取，得到原始语音特征向量；将原始语音特征向量输入到稀疏桥接Transformer模块中，输出融合特征；将融合特征输入到大语言模型中，通过文本解码生成连贯的语音情感提示信息，并关联对应的情感标签；该多模态情感提示方法及系统，实现了对在线辅助语音对话场景下语音情感的精准分析与提示。

技术关键词

提示方法融合特征交叉注意力机制标签场景语音特征提取数据文本在线多模态情感类别训练语音模型大语言模型生成语音情感分类模型语音活动检测矩阵模块

系统为您推荐了相关专利信息

基于智能终端的单相接地故障行波定位方法

行波检测装置卷积神经网络模型单相接地故障故障行波定位方法

基于温敏特征及非参迁移学习的响应潜力评估方法及系统

潜力评估方法深度置信网络温度敏感型非线性映射关系多项式

基于深度学习的儿童肥胖风险预测系统

风险预测系统儿童风险预测模型特征提取单元注意力机制

一种基于环境监测站点与敏感城市的关中地区沙尘天气预报方法

环境监测站点天气预报方法城市环境监测数学模型传输路径

一种复杂条件下的多模态点云高精度配准方法

高精度配准方法交叉注意力机制高维特征向量联合损失函数点云特征

一种在线辅助语音对话场景的多模态情感提示方法及系统

站点导航

APP 下载