摘要
本申请涉及视频分析技术领域,公开一种用于分析视频的方法,包括:通过分享链接获取完整视频;其中,完整视频包括原始音频数据及视频数据;对完整视频进行语音识别,获得原始音频数据所对应的文本数据;截取完整视频中的视频数据,获得视频帧图像;根据文本数据及视频帧图像、多模态大模型对完整视频进行高光片段识别,获得完整视频中的高光片段。该方法能够消除高光片段识别过程中对用户行为数据的依赖性,提升视频内容识别的准确性。本申请还公开一种用于分析视频的装置及电子设备、计算机可读存储介质。
技术关键词
视频帧
视频内容特征
多模态
电子设备本体
文本
数据
自动语音识别技术
体育
视频分析技术
可读存储介质
词语
音频
计算机
图像压缩
程序
指令
系统为您推荐了相关专利信息
生物特征数据
身份认证系统
多模态特征融合
生物特征识别模块
身份认证方法
机器翻译模型
翻译方法
多模态
认知负荷评估
信息编码