一种基于多模态模型的情绪动态分解与响应方法

正文

推荐专利

申请号：CN202510598430

申请日期：2025-05-09

公开号：CN120496579A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种基于多模态模型的情绪动态分解与响应方法，包括：采集并预处理用户的语音数字信号；将语音数字信号输入语音识别模型，输出语音文字；将语音文字输入大语言模型，生成回复文字；将响应情绪标签和回复文字输入语音情绪模型，生成带有情绪的回复语音。本发明解决了现有技术中以文本或简单语音指令为主的人机交互模式对用户情绪感知有限的问题，能够深入理解用户情绪背后的复杂意图和情感需求，有效解决了传统单一模态情绪识别技术的局限性；通过融合多模态信息，充分利用语音、图像等不同模态的优势，有效弥补各自缺陷，在各种复杂环境下都能准确识别用户情绪，大幅提高识别准确率。

技术关键词

序列标签语音识别模型语音数字信号处理令牌语义向量注意力大语言模型表情特征提取特征提取模型节点关系融合多模态信息梅尔频率倒谱系数模块视觉情绪识别技术

系统为您推荐了相关专利信息

基于柯氏音的心血管风险检测方法

描述符人工智能引擎注意力柯氏音心血管风险评估

一种基于物联网的新能源电网次同步振荡广域监测方法

新能源电网网络拓扑节点支持向量机模型灰狼优化算法

基于物理模型的边坡监测系统

边坡监测系统指数时间段材料特征阶段

一种基于迁移学习和标签噪声过滤的遥感数据分类方法

样本遥感数据分类表达式多模态特征融合动态

探视管理方法以及电子设备

管理方法语音识别模型音视频情绪识别模型语音特征

一种基于多模态模型的情绪动态分解与响应方法

站点导航

APP 下载