摘要
本发明提供一种基于上下文信息增强的短视频智能理解方法,属于数据分析技术领域,具体包括:按照关键帧特征的顺序进行时间关系建模获得短视频的全局特征,以短视频的全局特征以及视频大纲为基础数据作为LLM模型的输入,利用LLM模型的输出得到视频上下文信息,以视频上下文信息和用户的指导性信息为基础,得到短视频的模块化理解结果,并以模块化理解结果作为输入,利用大模型进行所述短视频的评判结果的确定,通过短视频的评判结果以及视频上下文信息进行反思处理模式的确定,并根据反思处理结果得到模块化的短视频智能理解结果,保证了短视频的智能理解结果的准确性。
技术关键词
短视频
视频帧
融合特征
关键帧
自动语音识别
关系建模
光学字符识别
主题
关键性
数据分析技术
封面
模式
图像分析
基础
文本
系统为您推荐了相关专利信息
输出特征
图像分割模型
牙齿图像分割方法
编码器
全局特征提取
热带气旋强度
卫星云图
深度卷积神经网络
强度预测方法
因子
界面特征
卷积神经网络模型
压缩特征
注意力机制
坐标