一种面向多模态的幽默识别方法

正文

推荐专利

一种面向多模态的幽默识别方法

申请号：CN202510021534

申请日期：2025-01-07

公开号：CN119863742B

公开日期：2025-09-26

类型：发明专利

摘要

本发明提供了一种面向多模态的幽默识别方法，涉及多模态幽默识别技术领域，在一种实现方式中，本发明将引入的外部知识作为单独模态，并与文本、音频和视频模态进行融合。先通过全连接层进行维度对齐，再将其拼接输入到Transformer中学习四种模态之间的交互关系，同时借助交叉注意力机制对模态融合进行了优化，由此解决了外部知识引入和模态融合方案的问题。在另一种实现方式中，通过图注意力网络进行数据增强，来弥补当前数据集数量稀缺的问题，将相关模态进行融合拼接，然后送入到交叉注意力网络中，再通过多头自注意力层进一步融合，最后输入到最大池层获得融合向量的单一特征表示，得到幽默极性的预测概率分布，由此得到更加有效的模态融合。

技术关键词

模态特征幽默识别方法幽默特征交叉注意力机制人脸图像特征融合特征文本特征向量视觉节点特征人脸特征向量音频特征多头注意力机制多模态前馈神经网络矩阵

系统为您推荐了相关专利信息

一种基于图像识别的墨水余量监测方法及系统

超声波特征专用墨水多模态传感器光源系统多维特征数据

基于光学和SAR遥感影像的建筑物屋顶提取方法

高层次模态特征多尺度特征融合影像注意力机制

一种基于多模态的广告推荐方法及相关装置

广告推荐方法 BERT模型跨模态文本视频帧

用于从图像数据中提取环境特征的技术

特征提取模型视觉文本环境图像数据环境传感器数据

一种基于多正样本匹配的多模态对比学习遥感分类方法

遥感分类方法激光雷达数据高层语义特征融合特征样本

一种面向多模态的幽默识别方法

站点导航

APP 下载