摘要
本公开的实施例提供了用于查询处理的方法、装置、设备和存储介质。该方法包括:获取视频、与视频相关联的参考图像和针对视频的查询,查询指示与视频和参考图像相关的问题;基于视频、参考图像和查询,构建针对经训练的第一多模态模型的模型输入;以及通过将模型输入提供给第一多模态模型,获得模型输出,模型输出指示对问题的应答。
技术关键词
多模态
计算机可执行指令
生成训练图像
对象
处理器
样本
视频帧
计算机程序产品
电子设备
可读存储介质
存储器
标签
序列
模块
文本
视觉
系统为您推荐了相关专利信息
同步控制模块
芯片可靠性测试
时间同步
同步方法
指令
训练数据采集方法
跨模态
文本
编码特征
语义特征提取
像素点
环境艺术设计
图像渲染方法
亮度
可视化界面
制造执行系统
数字孪生系统
指标
数据
参数优化方法