一种仿生的长视频理解方法及相关装置

正文

推荐专利

一种仿生的长视频理解方法及相关装置

申请号：CN202411644109

申请日期：2024-11-18

公开号：CN119676508A

公开日期：2025-03-21

类型：发明专利

摘要

本申请提供一种仿生的长视频理解方法及相关装置，通过获取长视频内容数据，并对所述长视频内容数据进行视频预处理，得到多个短视频片段，所述短视频片段至少包含视频段大小、视频字幕以及开放词汇；之后将所述多个短视频片段存储至向量数据库，同时所述向量数据库接收用户端发送的动态任务问题；最后依据所述多个短视频片段，调用多模态大模型对所述动态任务问题进行任务评估、分解、规划以及工具调用，以实现长视频理解。本申请技术方案通过观察人类对长视频检索和理解的过程，以达到减少计算量、提高计算效率、快速适应下游任务的目的。

技术关键词

短视频视频理解方法字幕自动语音识别技术非暂时性机器可读存储介质视频段视频帧处理单元数据生成技术多模态动态理解系统处理器分段规划电子设备图像

系统为您推荐了相关专利信息

视频生成方法、系统及装置

动画素材视频生成方法模板文本生成视频字幕

认知状态分类方法、装置、设备和存储介质

组学特征定量磁化率状态分类方法影像非暂时性机器可读存储介质

基于知识图谱的视频伪造分析方法

关键帧图谱分析方法画面识别视频片段

短视频的理解文本生成方法、装置、设备及存储介质

文本生成方法短视频长短期记忆网络序列视频帧

一种高密度立体复合城市形态特征测度方法、计算装置和存储介质

立体高密度层次聚类算法非暂时性机器可读存储介质覆盖率

一种仿生的长视频理解方法及相关装置

站点导航

APP 下载