视频描述信息生成方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
视频描述信息生成方法、装置、电子设备和存储介质
申请号:CN202511159310
申请日期:2025-08-18
公开号:CN120980319A
公开日期:2025-11-18
类型:发明专利
摘要
本申请提供了一种视频描述信息生成方法、装置、电子设备和存储介质。该方法包括:获取预设描述信息生成模型,以及视频流;将视频流输入预设描述信息生成模型,生成视频流的视频描述信息;其中,预设描述信息生成模型获取视频流中的GOP,将每个GOP内的帧压缩信息通过预设编码模型生成Token;并使用预设大语言模型生成每个Toke对应的视频描述信息,将所有GOP对应的视频描述信息按照对应GOP在视频流中的顺序拼接,生成视频流的视频描述信息。该方法基于包括完整GOP的视频流即可在低计算要求的前提下准确生成对应视频流的视频描述信息。
技术关键词
大语言模型 编解码 信息生成方法 比特流 残差信息 生成视频流 三通道 样本 编码 数据 信息生成装置 电子设备 亮度 处理器 可读存储介质 文本
系统为您推荐了相关专利信息
1
一种小模型API服务的调用方法、系统及存储介质
字典 检索算法 参数 大语言模型 格式
2
语音增强模块
音频编解码器 GPIO接口 电声转换设备 语音 数字音频接口
3
基于原子知识算子的大语言模型异构知识推理方法及装置
知识推理方法 节点 大语言模型 异构 答案
4
基于人工智能的产品推荐文案生成方法、装置、设备及介质
推荐文案生成方法 大语言模型 保险产品推荐 语句 客户
5
基于图检索增强智能体的建筑电梯检测诊断决策方法
诊断决策方法 实体 图谱 大语言模型 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号