一种基于上下文信息增强的短视频智能理解方法

AITNT
正文
推荐专利
一种基于上下文信息增强的短视频智能理解方法
申请号:CN202410973299
申请日期:2024-07-19
公开号:CN118865207A
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供一种基于上下文信息增强的短视频智能理解方法,属于数据分析技术领域,具体包括:按照关键帧特征的顺序进行时间关系建模获得短视频的全局特征,以短视频的全局特征以及视频大纲为基础数据作为LLM模型的输入,利用LLM模型的输出得到视频上下文信息,以视频上下文信息和用户的指导性信息为基础,得到短视频的模块化理解结果,并以模块化理解结果作为输入,利用大模型进行所述短视频的评判结果的确定,通过短视频的评判结果以及视频上下文信息进行反思处理模式的确定,并根据反思处理结果得到模块化的短视频智能理解结果,保证了短视频的智能理解结果的准确性。
技术关键词
短视频 视频帧 融合特征 关键帧 自动语音识别 关系建模 光学字符识别 主题 关键性 数据分析技术 封面 模式 图像分析 基础 文本
系统为您推荐了相关专利信息
1
牙齿图像分割模型训练方法、分割方法、设备和存储介质
输出特征 图像分割模型 牙齿图像分割方法 编码器 全局特征提取
2
一种目标导向的扫视路径预测方法
扫视路径预测方法 注视点 代表 视觉特征 层级
3
一种气旋强度预测方法及装置
热带气旋强度 卫星云图 深度卷积神经网络 强度预测方法 因子
4
界面分析方法、装置、存储介质及电子设备
界面特征 卷积神经网络模型 压缩特征 注意力机制 坐标
5
动态序列复用视频加密方法和装置、系统、存储介质
视频加密方法 视频加密装置 序列 明文 动态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号