摘要
本发明公开了一种在线辅助语音对话场景的多模态情感提示方法及系统,涉及人工智能技术领域,将语音对话场景中的语音信号输入到训练好的多模态情感提示大模型中,输出情感标签及语音情感提示信息;多模态情感提示大模型的训练过程如下:获取真实对话场景的原始语音数据以构建情感识别的训练数据集;对训练数据集中的原始语音数据进行特征提取,得到原始语音特征向量;将原始语音特征向量输入到稀疏桥接Transformer模块中,输出融合特征;将融合特征输入到大语言模型中,通过文本解码生成连贯的语音情感提示信息,并关联对应的情感标签;该多模态情感提示方法及系统,实现了对在线辅助语音对话场景下语音情感的精准分析与提示。
技术关键词
提示方法
融合特征
交叉注意力机制
标签
场景
语音特征提取
数据
文本
在线
多模态
情感类别
训练语音模型
大语言模型
生成语音
情感分类模型
语音活动检测
矩阵
模块
系统为您推荐了相关专利信息
行波检测装置
卷积神经网络模型
单相接地故障
故障行波
定位方法
潜力评估方法
深度置信网络
温度敏感型
非线性映射关系
多项式
风险预测系统
儿童
风险预测模型
特征提取单元
注意力机制
环境监测站点
天气预报方法
城市环境监测
数学模型
传输路径
高精度配准方法
交叉注意力机制
高维特征向量
联合损失函数
点云特征