一种时序增强的视频问答方法及系统

正文

推荐专利

一种时序增强的视频问答方法及系统

申请号：CN202510156668

申请日期：2025-02-13

公开号：CN119670896B

公开日期：2025-06-03

类型：发明专利

摘要

本发明涉及一种时序增强的视频问答方法及系统，涉及时序视频问答领域；包括：步骤1：多维时序指令数据构造；明确并定义五个时序维度，建立数据收集与筛选流程，确保每个时序维度的数据准备工作完备；步骤2：多任务时序指令微调；构造多个时序辅助任务，利用所收集的数据对视频问答模型进行微调，以增强模型的时序问答能力；步骤3：多维时序问答评估；针对五个时序维度，额外收集和构造评估数据集，评估视频问答模型的时序问答能力。针对每个维度都设计了特定的数据收集和构造方法，为增强视频问答模型的时序问答能力提供了数据基础。突破了数据容量的限制，能够在多个维度上有效提升视频问答模型的时序问答能力。

技术关键词

视频问答方法问答模型时序数据语义特征指令答案时间定位视频帧自然语言多任务视觉特征过滤器文本混合构造动态微调单元序列问答系统

系统为您推荐了相关专利信息

基于混合损失的问答处理方法、装置、电子设备及介质

问答模型答案联合损失函数阶段样本

一种智能家居的电控自动化测试方法及系统

测试设备自动化测试方法人工智能模型脚本深度学习框架

一种针对激光划线的焦点跟随控制方法及装置

运动控制卡驱动音圈电机跟随控制方法模拟量采集模块支持多通道扩展

一种虚实场景融合的移动型机器人三维训练环境重建方法

环境重建方法移动型机器人机器人模型三维场景模型激光雷达点云数据

直播交互方法、装置、电子设备、存储介质及程序产品

直播交互方法终端设备直播视频数据关系交互装置

一种时序增强的视频问答方法及系统

站点导航

APP 下载