摘要
本申请属于人工智能技术领域,公开了一种基于检索智能体的视频检索方法,包括索引阶段和信息检索阶段,索引阶段将视频数据及其关联的多模态特征进行结构化组织,以支持后续的高效检索与匹配,信息检索阶段中,用户查询首先通过与视频目录大纲的向量相似度匹配完成初步的召回,接着,引入思维链式推理策略,将复杂问题拆解为多个子问题,并将这些子问题交给具备检索能力的智能体逐一解决。本申请是一种具备推理驱动和多模态融合能力的创新工作流,它不仅能够在确保高召回率的前提下提升语义精准度,还显著增强大模型对复杂任务的理解和应答能力,尤其在开放领域问答、视频内容检索以及多跳知识推理等高复杂度应用场景中,展现出卓越的优势。
技术关键词
视频检索方法
关键帧
邻居
文本
目录
音频
大语言模型
阶段
框架生成方法
关键词
列表
画面
语义
时序
连续性
信息检索
生成视频片段
索引
场景
系统为您推荐了相关专利信息
辅助分析方法
地理实体
辅助分析装置
非结构化文本
关系
病灶定位方法
图像编码器
模块
大语言模型
影像分析技术