一种时序增强的视频问答方法及系统

AITNT
正文
推荐专利
一种时序增强的视频问答方法及系统
申请号:CN202510156668
申请日期:2025-02-13
公开号:CN119670896B
公开日期:2025-06-03
类型:发明专利
摘要
本发明涉及一种时序增强的视频问答方法及系统,涉及时序视频问答领域;包括:步骤1:多维时序指令数据构造;明确并定义五个时序维度,建立数据收集与筛选流程,确保每个时序维度的数据准备工作完备;步骤2:多任务时序指令微调;构造多个时序辅助任务,利用所收集的数据对视频问答模型进行微调,以增强模型的时序问答能力;步骤3:多维时序问答评估;针对五个时序维度,额外收集和构造评估数据集,评估视频问答模型的时序问答能力。针对每个维度都设计了特定的数据收集和构造方法,为增强视频问答模型的时序问答能力提供了数据基础。突破了数据容量的限制,能够在多个维度上有效提升视频问答模型的时序问答能力。
技术关键词
视频问答方法 问答模型 时序 数据 语义特征 指令 答案 时间定位 视频帧 自然语言 多任务 视觉特征 过滤器 文本 混合构造 动态 微调单元 序列 问答系统
系统为您推荐了相关专利信息
1
基于混合损失的问答处理方法、装置、电子设备及介质
问答模型 答案 联合损失函数 阶段 样本
2
一种智能家居的电控自动化测试方法及系统
测试设备 自动化测试方法 人工智能模型 脚本 深度学习框架
3
一种针对激光划线的焦点跟随控制方法及装置
运动控制卡 驱动音圈电机 跟随控制方法 模拟量采集模块 支持多通道扩展
4
一种虚实场景融合的移动型机器人三维训练环境重建方法
环境重建方法 移动型机器人 机器人模型 三维场景模型 激光雷达点云数据
5
直播交互方法、装置、电子设备、存储介质及程序产品
直播交互方法 终端设备 直播视频数据 关系 交互装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号