摘要
本发明提供一种多模态内容审查方法、设备、介质及计算机程序,涉及内容审查技术领域。该多模态内容审查方法包括:调用专用识别模型识别目标审查内容中的字幕及语音,得到文字识别结果和语音识别结果;专用识别模型为基于内容样本及内容样本的字幕标签、语音标签学习得到的模型;调用人工智能大模型,按照违规审查规则,对文字识别结果、语音识别结果以及目标审查内容的视频画面进行融合分析推理,输出违规行为识别结果。本发明基于人工智能大模型良好的认知能力提高了内容审查方法的通用性;将人工智能大模型与专用小模型进行有机结合,充分发挥了人工智能大模型的理解认知能力以及专用小模型的感知能力,实现了对内容的准确有效审查。
技术关键词
专用识别
语音识别模型
视频
多模态
字幕
语音标签
画面
处理器
场景
计算机程序产品
样本
音频
存储器
电子设备
介质
图像
逻辑
系统为您推荐了相关专利信息
交互机器人
多模态
数据采集器
设备控制方法
身份
推荐商品信息
商品推荐方法
编码向量
计算机可读指令
文本
联合检测方法
图像特征向量
唾液
特征提取模型
多模态
数据处理系统
图像特征数据
数据处理方法
多模态
数据处理模块
胶囊网络模型
智能家居设备
数据
多模态
卷积神经网络技术