摘要
本公开提供了一种基于大模型的问答信息生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于人机交互等场景。具体实现方案为:根据提问文本和与提问文本相关联的图像,生成初始应答文本;确定针对图像的图像内容的第一描述文本;确定针对图像中对象的第二描述文本;以及根据提问文本、第一描述文本和第二描述文本,基于大模型对初始应答文本进行修正,得到目标应答文本。
技术关键词
文本
图像
对象
子模块
信息生成方法
模板组合
数据
信息生成装置
电子设备
人工智能技术
计算机程序产品
计算机视觉
处理器通信
指令
语义
可读存储介质
存储器
系统为您推荐了相关专利信息
语义地图
可移动设备
障碍物检测方法
对象
神经网络模型
分类方法
网络
注意力机制
图像块
Softmax函数
机电一体化产品
系统控制模块
深度卷积神经网络
分布式数据库
数据管理模块
低空飞行器
多尺度特征融合
输出特征
图像
策略优化模型
双目相机
标定板图像
十字滑台
法兰盘
数据处理单元