一种视频理解的处理方法、装置、设备以及存储介质

AITNT
正文
推荐专利
一种视频理解的处理方法、装置、设备以及存储介质
申请号:CN202510738183
申请日期:2025-06-04
公开号:CN120564105A
公开日期:2025-08-29
类型:发明专利
摘要
本申请提供一种视频理解的处理方法、装置、设备以及存储介质,属于视频理解的技术领域。所述方法包括获取目标视频和目标提问文本,并根据所述目标提问文本,生成视频段检索指示文本;将所述目标视频、目标提问文本和所述视频段检索指示文本输入所述粗粒度视频大语言模型,所述视频段检索指示文本用于指示所述粗粒度视频大语言模型在所述目标视频中提取与所述目标提问文本相关的关键片段;将所述粗粒度视频大语言模型输出的所述关键片段和所述目标提问文本输入所述细粒度视频大语言模型,所述细粒度视频大语言模型用于根据所述关键片段和所述目标提问文本输出最终回答。本申请旨在提高视频理解结果准确性。
技术关键词
大语言模型 文本 视频段 非易失性可读存储介质 样本 强化学习策略 视觉 处理器 存储器 标签 电子设备 模块
系统为您推荐了相关专利信息
1
一种工业配方和工艺知识答案生成方法及装置
答案生成方法 建立倒排索引 工业 命名实体识别 节点
2
基于深度学习的变电站远程故障预警系统及方法
变电站运行数据 重构误差 编码器 萤火虫优化算法 故障预警方法
3
电池剩余容量估计方法、装置、设备及存储介质
电池充电数据 充电截止电压 电池剩余容量 曲线 样本
4
基于改进的ViT损失分布差异的对抗样本检测方法及系统
样本检测方法 分层注意力 样本检测系统 特征加权融合 损失函数优化
5
一种基于指纹色谱图谱的茶叶质量等级评定方法和系统
茶叶提取 等级评定方法 模式识别方法 代谢指纹图谱 指纹图谱建立
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号