视频描述文本生成方法、装置、计算机设备和存储介质

正文

推荐专利

申请号：CN202510950480

申请日期：2025-07-09

公开号：CN120912894A

公开日期：2025-11-07

类型：发明专利

摘要

本申请涉及机器学习技术领域，涉及一种视频描述文本生成方法、装置、计算机设备和存储介质，该方法包括：获取目标视频的特征数据；将特征数据输入第一路径特征提取模型，通过第一路径特征提取模型输出当前帧特征；将特征数据输入第二路径特征提取模型，通过第二路径特征提取模型输出未来帧特征；根据未来帧特征更新数据库，获得更新的数据库特征；将当前帧特征与数据库特征进行融合，获得融合特征；将融合特征进行解码，生成目标视频对应的视频描述文本。本申请可应用于金融、医疗等领域，实现了时序连贯的视频描述文本生成。

技术关键词

特征提取模型文本生成方法融合特征神经网络模型视频计算机设备注意力解码器模型机器学习技术数据库更新可读存储介质存储计算机程序特征提取模块处理器矩阵存储器

视频描述文本生成方法、装置、计算机设备和存储介质

站点导航

APP 下载