摘要
本发明提供一种基于上下文信息增强的短视频智能理解方法,属于数据分析技术领域,具体包括:按照关键帧特征的顺序进行时间关系建模获得短视频的全局特征,以短视频的全局特征以及视频大纲为基础数据作为LLM模型的输入,利用LLM模型的输出得到视频上下文信息,以视频上下文信息和用户的指导性信息为基础,得到短视频的模块化理解结果,并以模块化理解结果作为输入,利用大模型进行所述短视频的评判结果的确定,通过短视频的评判结果以及视频上下文信息进行反思处理模式的确定,并根据反思处理结果得到模块化的短视频智能理解结果,保证了短视频的智能理解结果的准确性。
技术关键词
短视频
视频帧
融合特征
关键帧
自动语音识别
关系建模
光学字符识别
主题
关键性
数据分析技术
封面
模式
图像分析
基础
文本
系统为您推荐了相关专利信息
异常检测方法
视频帧
异常检测程序
异常检测装置
频率
接线检查方法
视频
接线检查装置
电力设备
检查系统
审核模型
风险
神经网络模型
预训练模型
可读存储介质
攻击预测方法
序列
融合卷积神经网络
数据平衡方法
残差学习