基于结构化语法信息的视频内容理解方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202511110423

申请日期：2025-08-08

公开号：CN120976832A

公开日期：2025-11-18

类型：发明专利

摘要

本申请在计算机应用技术领域，公开了基于结构化语法信息的视频内容理解方法、装置、电子设备及存储介质，该方法包括：将训练样本输入目标模型进行内容理解处理，得到预测文本，并构建预测文本对应的句法树；计算句法树与参考文本的句法树之间的句法树编辑距离；利用句法树编辑距离计算语言结构损失，利用语言结构损失对目标模型的模型参数进行更新；在训练好目标模型的模型参数的情况下，获取目标视频；将目标视频输入目标模型进行处理，得到目标视频的内容文本。在本申请中，基于语法树算出的语言结构损失训练目标模型，可对目标视频进行理解，从而得到具备语法准确、句子结构合理且自然的内容文本。

技术关键词

视频内容理解方法文本编辑音频编码器语法结构跨模态音频特征视觉特征解码器多模态特征参数模型训练模块电子设备可读存储介质存储计算机程序树形结构节点

系统为您推荐了相关专利信息

基于大模型的物料码垛方法、装置、设备及介质

码垛物料图像处理模型文本交互模型指令

基于多源特征融合的中医方剂智能推荐方法、介质和设备

多源特征融合智能推荐方法方剂患者协同过滤推荐

基于客户感知的多维服务评价词云图表生成方法和装置

文本主题词生成评论文本客户图表生成方法序列

一种基于小说消费场景的智能化广告投放优化方法

广告投放优化方法 NLP技术广告投放策略画像广告主

一种供应商关系类型识别方法及相关装置

关系多模态大语言模型图片计算机设备

基于结构化语法信息的视频内容理解方法、装置、电子设备及存储介质

站点导航

APP 下载