视频理解方法、装置、电子设备及存储介质

正文

推荐专利

视频理解方法、装置、电子设备及存储介质

申请号：CN202510748870

申请日期：2025-06-05

公开号：CN120894724A

公开日期：2025-11-04

类型：发明专利

摘要

本公开提供了视频理解方法、装置、电子设备及存储介质，涉及深度学习、大模型、计算机视觉以及自然语言处理等人工智能领域。其中的方法可包括：对待处理视频进行采样，得到采样出的M帧原始图像，M为大于1的正整数；获取待处理视频对应的音频的文本识别结果；根据各原始图像以及所述文本识别结果确定出目标输入信息；将目标输入信息输入视频理解模型，得到待处理视频对应的视频理解结果。

技术关键词

视觉特征文本识别视频理解方法图像音频识别模块指令自动语音识别采样模块序列电子设备计算机程序产品计算机视觉处理器通信自然语言可读存储介质

系统为您推荐了相关专利信息

一种奶牛乳头处理系统及应用方法

多轴机器人奶牛乳头涂膜设备挤奶设备消毒设备

基于扩散模型的多模态产品设计快速迭代方法和系统

迭代方法变量概念图片注意力机制

一种基于边缘检测的轮廓提取方法

轮廓提取方法边缘检测复杂度图像噪声水平纹理特征

基于广义Nesterov迭代快速梯度符号法与伪标签一致性正则化的单阳性多标签胸部X光图像分类方法

胸部X光图像多标签分类方法广义符号

一种基于多模态增强的口腔图像处理方法及系统

融合置信度像素点图像处理方法多模态可见光图像

视频理解方法、装置、电子设备及存储介质

站点导航

APP 下载