摘要
本发明公开了一种视频内容安全理解方法、系统、设备及存储介质,它们是相对应的方案,方案中:引入基于语义评分策略的视频帧采样模块,可优先选择与有害内容高度相关的视频帧,从而提升采样效率和模型对关键事件的捕捉能力;提出的思维链框架将有害内容检测任务分解为若干结构化推理子步骤,引导模型系统分析视频的视觉和文本信息,从而提升检测精度、可解释性和鲁棒性,也有利于视频理解大模型更好地确认并使用捕捉到的视觉和文本信息。
技术关键词
视频帧
文本概括
语义
采样模块
生成输入视频
数据
图像
图片
策略
矩阵
序列
理解系统
合并算法
预训练模型
大语言模型
处理器
视觉特征
框架
系统为您推荐了相关专利信息
机器人高精度
定位导航系统
多传感器融合
室内清洁机器人
安防巡逻机器人
高光谱识别方法
海面溢油
链条系统
模拟真实场景
机载高光谱
知识问答方法
机器可读程序
二维码
微信公众号
文本