摘要
本发明提供了一种多模态视频信息监测方法、装置、计算机设备及介质,属于信息识别领域,该方法包括:构建多模态敏感信息识别模型;获取目标视频以及目标视频对应用户的历史敏感信息;确定敏感信息的图像类型,根据该图像类型提取目标视频的第一图像帧;提取出目标视频的文本信息和音频信息,并通过该历史敏感信息调整SE中的模态权重;将该文本信息、第一图像帧以及音频信息输入至多模态敏感信息识别模型,得到敏感信息的识别结果。首先提取出与敏感信息相关的图像帧,减少目标视频中的无效信息,其次通过历史敏感信息记录调整模态权重,提高了对敏感信息识别的准确性,然后再对多种模态信息的特征进行融合,进一步提高了对多模态敏感信息的识别。
技术关键词
信息监测方法
敏感信息识别
多模态
视频
融合特征
图像
文本
音频
样本
计算机设备
信息监测装置
模态特征
光学字符识别
分类器
处理器
注意力
识别模块
可读存储介质
存储器
系统为您推荐了相关专利信息
图像特征向量
文本生成模型
文本生成方法
特征提取模块
输出模块
图像对象特征
文本生成图像
语义评测方法
关系
多模态
多模态
快速检测方法
压实度
机器学习模型
高填方路基
汽车电池
智能功率分配方法
驾驶舱
客舱
加热部件