视频理解大模型的训练方法、视频理解方法和智能体

正文

推荐专利

申请号：CN202510612238

申请日期：2025-05-13

公开号：CN120525049A

公开日期：2025-08-22

类型：发明专利

摘要

本公开提供了一种视频理解大模型的训练方法，可以应用于人工智能技术领域和视频理解技术领域。该视频理解大模型的训练方法包括：获取多个第一训练样本，其中，第一训练样本包括样本视频、第一问题文本和第一答案文本；基于多个预设大模型各自对多个第一训练样本的测试结果，对多个第一训练样本进行样本筛选，得到多个第二训练样本；分别对多个第二训练样本各自的文本内容进行预处理，得到多个第三训练样本；以及利用多个第三训练样本对初始模型进行微调训练，得到目标视频理解大模型。本公开还提供了一种视频理解方法、一种智能体。

技术关键词

视频理解方法答案文本理解生成输出信息语义特征样本融合特征输入模块理解技术视频帧人工智能技术时序风格输出模块框架视觉线索

视频理解大模型的训练方法、视频理解方法和智能体

站点导航

APP 下载