摘要
本申请公开了一种大屏视频内容审核方法、设备以及存储介质,涉及互联网安全技术领域,包括:获取待审核视频,对待审核视频进行解耦处理,得到待审核视频中的音频流和多帧视频帧,并将音频流转换为音频文本;对音频文本执行文本合规检测操作,得到音频文本对应的第一文本审核结果;对视频帧执行图像合规检测操作,得到视频帧对应的图像审核结果;若第一文本审核结果和图像审核结果中的任意一个为不合规,确定待审核视频的视频审核结果为不合规,并采用预设合规视频替换待审核视频,以使预设合规视频于大屏显示设备上播放,解决单模态检测在复杂场景中识别准确率低的技术问题,提升视频内容审核的准确性与可靠性。
技术关键词
视频内容审核方法
视频帧
文本分类模型
音频
文本特征向量
对象
人脸识别模型
训练图像分类模型
互联网安全技术
面部
图像类别
大屏显示设备
高清多媒体接口
字符识别模型
视频图形阵列