视频描述信息生成方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202511159310

申请日期：2025-08-18

公开号：CN120980319A

公开日期：2025-11-18

类型：发明专利

摘要

本申请提供了一种视频描述信息生成方法、装置、电子设备和存储介质。该方法包括：获取预设描述信息生成模型，以及视频流；将视频流输入预设描述信息生成模型，生成视频流的视频描述信息；其中，预设描述信息生成模型获取视频流中的GOP，将每个GOP内的帧压缩信息通过预设编码模型生成Token；并使用预设大语言模型生成每个Toke对应的视频描述信息，将所有GOP对应的视频描述信息按照对应GOP在视频流中的顺序拼接，生成视频流的视频描述信息。该方法基于包括完整GOP的视频流即可在低计算要求的前提下准确生成对应视频流的视频描述信息。

技术关键词

大语言模型编解码信息生成方法比特流残差信息生成视频流三通道样本编码数据信息生成装置电子设备亮度处理器可读存储介质文本

系统为您推荐了相关专利信息

一种小模型API服务的调用方法、系统及存储介质

字典检索算法参数大语言模型格式

语音增强模块

音频编解码器 GPIO接口电声转换设备语音数字音频接口

基于原子知识算子的大语言模型异构知识推理方法及装置

知识推理方法节点大语言模型异构答案

基于人工智能的产品推荐文案生成方法、装置、设备及介质

推荐文案生成方法大语言模型保险产品推荐语句客户

基于图检索增强智能体的建筑电梯检测诊断决策方法

诊断决策方法实体图谱大语言模型数据

视频描述信息生成方法、装置、电子设备和存储介质

站点导航

APP 下载