摘要
本申请涉及人工智能技术领域,尤其涉及一种基于大模型的问答数据构建方法、装置、设备及介质。由于在本申请实施例中,根据获取到的不同特征提取策略对应的第一提示文本和模型,确定待处理图像对应不同特征提取策略的特征描述,而不是仅仅确定待处理图像的某一个特征,并且将每个特征描述输入到第一多模态大模型中,得到待处理图像的概述文本,也就是说,利用第一多模态大模型对所有特征描述进行总结,得到的该概述文本是融合了多个特征的,将待处理图像、概述文本以及预先保存的提问内容输入到第二多模态大模型中,得到的提问内容对应的答复信息是第二多模态大模型根据涵盖了多个特征描述的概述文本分析得到的,构建了全面和准确的问答数据。
技术关键词
多模态
数据构建方法
图像
文本
视频
人工智能技术
电子设备
处理器
可读存储介质
模块
字符
格式
存储器
计算机
轨迹
算法
运动
系统为您推荐了相关专利信息
标志物
荧光
计算机视觉
多尺度特征
多尺度卷积神经网络
呼吸运动模型
反光标记
补偿方法
反向映射方法
患者体表标记
无人机避障方法
场景类别
训练样本数据
轨迹预测模型
场景分类