摘要
本发明涉及一种时序增强的视频问答方法及系统,涉及时序视频问答领域;包括:步骤1:多维时序指令数据构造;明确并定义五个时序维度,建立数据收集与筛选流程,确保每个时序维度的数据准备工作完备;步骤2:多任务时序指令微调;构造多个时序辅助任务,利用所收集的数据对视频问答模型进行微调,以增强模型的时序问答能力;步骤3:多维时序问答评估;针对五个时序维度,额外收集和构造评估数据集,评估视频问答模型的时序问答能力。针对每个维度都设计了特定的数据收集和构造方法,为增强视频问答模型的时序问答能力提供了数据基础。突破了数据容量的限制,能够在多个维度上有效提升视频问答模型的时序问答能力。
技术关键词
视频问答方法
问答模型
时序
数据
语义特征
指令
答案
时间定位
视频帧
自然语言
多任务
视觉特征
过滤器
文本
混合构造
动态
微调单元
序列
问答系统
系统为您推荐了相关专利信息
测试设备
自动化测试方法
人工智能模型
脚本
深度学习框架
运动控制卡
驱动音圈电机
跟随控制方法
模拟量采集模块
支持多通道扩展
环境重建方法
移动型机器人
机器人模型
三维场景模型
激光雷达点云数据
直播交互方法
终端设备
直播视频数据
关系
交互装置