视频理解方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
视频理解方法、装置、电子设备及存储介质
申请号:CN202510748870
申请日期:2025-06-05
公开号:CN120894724A
公开日期:2025-11-04
类型:发明专利
摘要
本公开提供了视频理解方法、装置、电子设备及存储介质,涉及深度学习、大模型、计算机视觉以及自然语言处理等人工智能领域。其中的方法可包括:对待处理视频进行采样,得到采样出的M帧原始图像,M为大于1的正整数;获取待处理视频对应的音频的文本识别结果;根据各原始图像以及所述文本识别结果确定出目标输入信息;将目标输入信息输入视频理解模型,得到待处理视频对应的视频理解结果。
技术关键词
视觉特征 文本识别 视频理解方法 图像 音频识别模块 指令 自动语音识别 采样模块 序列 电子设备 计算机程序产品 计算机视觉 处理器通信 自然语言 可读存储介质
系统为您推荐了相关专利信息
1
一种奶牛乳头处理系统及应用方法
多轴机器人 奶牛乳头 涂膜设备 挤奶设备 消毒设备
2
基于扩散模型的多模态产品设计快速迭代方法和系统
迭代方法 变量 概念 图片 注意力机制
3
一种基于边缘检测的轮廓提取方法
轮廓提取方法 边缘检测 复杂度 图像噪声水平 纹理特征
4
基于广义Nesterov迭代快速梯度符号法与伪标签一致性正则化的单阳性多标签胸部X光图像分类方法
胸部X光图像 多标签 分类方法 广义 符号
5
一种基于多模态增强的口腔图像处理方法及系统
融合置信度 像素点 图像处理方法 多模态 可见光图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号