一种反电信欺诈的虚假人脸视频多模态帧级检测方法

正文

推荐专利

申请号：CN202411901236

申请日期：2024-12-23

公开号：CN119946353A

公开日期：2025-05-06

类型：发明专利

摘要

本发明公开了一种反电信欺诈的虚假人脸视频多模态帧级检测方法，特点是检测方法主要包括数据预处理、构建待训练的音视频神经网络检测模型、对检测模型的训练和对目标视频的检测识别的步骤；优点是同时利用了视频的视觉特征和音频特征，通过构建多模态神经网络，将视觉信息和音频信息进行深度融合。传统的伪造视频检测方法往往仅依赖于视觉特征，而本发明结合了音频信号，使得检测更加全面；通过对音视频特征的联合分析，本发明能够有效提高伪造视频片段检测的准确性，尤其是在伪造音视频同步欺诈场景中具有显著优势。

技术关键词

边界特征注意力音频特征音视频视觉特征融合特征通道元素数据多模态模块高层次视频帧 Sigmoid函数标签音频编码器嵌套结构

系统为您推荐了相关专利信息

一种基于大语言模型的多信息元素语义组合方法和系统

大语言模型组合方法字符高维向量空间文本

一种语义驱动的全息通信联合信源信道编码方法

语义联合信源信道编码 AF模块信道解码器 Sigmoid函数

一种基于Modelica语言的大模型驱动的汽车模型建模方法

Modelica语言汽车模型建模方法优化控制策略自然语言

一种基于影像组学注意力网络的HER2状态改变预测方法

组学特征影像组学技术肿瘤信息学技术灰度共生矩阵

基于多类对比学习的零样本故障诊断方法、系统及设备

故障特征预训练语言模型故障类别多尺度特征融合原型

一种反电信欺诈的虚假人脸视频多模态帧级检测方法

站点导航

APP 下载