一种基于多模态大模型的视频审核方法

正文

推荐专利

一种基于多模态大模型的视频审核方法

申请号：CN202411025607

申请日期：2024-07-29

公开号：CN118968380B

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的视频审核方法，包括：获取待审核视频，进行视频格式转换、视频质量提升等预处理操作，得到待审核多模态数据作为输入数据；输入数据为待审核多模态数据，包括图像序列Images、音频序列Audios、文本序列Texts；预处理得到多模态分类大模型网络，将输入数据输入至多模态分类大模型网络后输出分类结果及其对应分数，当分类结果为违规标签且对应分数大于预设阈值时，判定待审核视频为违规视频。本发明将图像特征、音频特征、文本特征使用改进注意力多模态特征融合方法进行特征融合，该方法能够充分利用不同模态信息的互补性，提高审核的准确性和鲁棒性。

技术关键词

视频审核方法多模态特征融合嵌入特征融合特征音频特征注意力权重特征网络文本序列数据图像输出特征标签全局平均池化模块

系统为您推荐了相关专利信息

一种用于多模态的档案数据共享智能监测方法及系统

智能监测方法数据共享平台多模态权限管理模块训练机器学习模型

一种肉牛爬跨行为监测方法及系统

监测方法时间序列信息梅尔频率倒谱系数多模态特征融合融合视觉

一种基于多分片的录音合成方法及系统

YOLOv3算法深度卷积神经网络分片时间偏移量音频特征

自适应差分隐私的联邦学习方法、客户端、服务器、存储介质及产品

差分隐私客户端联邦学习方法样本数据分布

基于深度学习语义分割模型的梯田提取方法及系统

卷积特征深度学习语义分割梯田提取方法上采样生成多尺度

一种基于多模态大模型的视频审核方法

站点导航

APP 下载