视频摘要生成方法、模型训练方法、装置和存储介质

AITNT
正文
推荐专利
视频摘要生成方法、模型训练方法、装置和存储介质
申请号:CN202510837508
申请日期:2025-06-20
公开号:CN120780869A
公开日期:2025-10-14
类型:发明专利
摘要
本公开提供了视频摘要生成方法、模型训练方法、装置和存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习等技术领域。具体实现方案为:在获取用户针对目标视频所输入的摘要生成需求文本后,确定目标视频的第一视频帧序列的第一视频帧向量序列以及摘要生成需求文本的第一语句序列的第一语句向量序列,并对第一视频帧向量序列和第一语句向量序列进行融合,得到第一视频帧序列的第一融合特征向量序列,以及根据第一融合特征向量序列确定第一视频帧序列的第一重要性评分序列,并根据第一重要性评分序列,从第一视频帧序列中确定第一目标视频帧,以及根据第一目标视频帧生成目标视频的视频摘要。由此,提升了视频摘要生成的准确性。
技术关键词
视频帧 视频摘要模型 序列 语句 视频摘要生成方法 样本 文本 注意力 多模态 编码向量 时序 视频摘要生成装置 模型训练方法 生成提示词 矩阵 模块 处理器
系统为您推荐了相关专利信息
1
一种时间序列异常检测阈值的自适应调整方法
滑动窗口 数据 频率 频域特征 周期性
2
一种基于纯文本数据的通用卡证识别模型构建方法及系统
文本信息提取 证件 识别模型构建方法 信息提取模型 文本分类模型
3
视频录制方法、装置、电子设备及可读存储介质
硬件抽象层 视频帧 视频录制方法 相机 缓冲器
4
一种基于树结构编码的层次时间序列预测方法及系统
时间序列预测方法 层次结构信息 时间序列预测系统 时间序列预测技术 节点
5
基于图灵机思想的大语言模型长度泛化数据驱动方法和设备
数据驱动方法 图灵机 数据驱动系统 大语言模型 线性
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号