基于语料库增强与跨模态生成的多模态情感分类方法及系统

正文

推荐专利

申请号：CN202510611903

申请日期：2025-05-13

公开号：CN120492806A

公开日期：2025-08-15

类型：发明专利

摘要

本发明涉及人工智能及情感识别技术领域，公开了一种基于语料库增强与跨模态生成的多模态情感分类方法及系统，方法包括如下步骤：步骤1、对多模态数据进行预处理与特征提取；其中：多模态数据包括视频模态、文本模态以及音频模态；步骤2、将各模态特征投影至低维共享空间；其中：通过全连接层将视频、文本、音频模态特征分别映射至统一低维空间，以消除模态间维度差异，并采用ReLU激活函数增强表达能力；步骤3、对输入的各模态特征进行基于文本库的特征增强，以输出增强后的模态特征。本方案支持单模态、双模态及三模态输入，适应实际应用中数据缺失的多样性，且模型识别准确率高。

技术关键词

情感分类方法模态特征文本动态门控情感分析方法多头注意力机制 Softmax分类器跨模态融合多模态信息动态位置编码 sigmoid函数情感识别技术数据双模态 BERT模型门控循环单元掩码规则音频

基于语料库增强与跨模态生成的多模态情感分类方法及系统

站点导航

APP 下载