一种基于关系感知矫正注意力网络的视听匹配方法

正文

推荐专利

申请号：CN202410972196

申请日期：2024-07-19

公开号：CN118897902A

公开日期：2024-11-05

类型：发明专利

摘要

本发明公开一种基于关系感知矫正注意力网络的视听匹配方法，利用关系感知模态间矫正注意力与自适应模态内矫正注意力共同探索不同模态语义特征之间的内在关联。关系感知模态间的矫正注意力机制通过关系感知网络获得的相关性信息，引导不同模态的特征进行目标明确的交互，以识别潜在的语义联系。鉴于不同模态间可能存在显著的信息差异，自适应模态内矫正注意力作为一个辅助机制，能够独立并有效地处理这些特征，进而深入挖掘各模态的特征表示。此外，这两种注意力模块均集成了自适应注意力矫正单元，以优化注意力分配，增强特征表示的同时减少干扰信息对网络的影响。通过强化正负样本之间的对比，相对距离拉伸度量损失有助于改善视听特征的嵌入表征。本发明在多个公共基准数据集上进行测试，覆盖多种场景，并展现出良好的性能表现。

技术关键词

矫正视听人脸图像特征关系音频表达式网络矩阵跨模态注意力机制样本语义度量超参数多层感知器身份组合方法

系统为您推荐了相关专利信息

一种基于体积应变评价致密储层可压性的方法

致密储层应力曲线层次分析法指数

一种基于麦克风阵列的雷声信号高效识别方法和系统

高效识别方法麦克风阵列音频信号识别模型滤波器

一种基于大模型的表格解析方法

表格解析方法视觉检测算法非结构化文档光学字符识别技术数据

车辆后视镜的自适应控制方法、装置、设备及存储介质

调节车辆后视镜图像账户调节误差实时位置

一种支持特征溯源的人群圈选方法及系统

标签贪心算法关系互联网营销技术回溯算法

一种基于关系感知矫正注意力网络的视听匹配方法

站点导航

APP 下载