摘要
本申请公开了一种用户问答方法、装置、设备、介质以及产品,涉及人工智能领域,方法包括:接收用户的提问信息,所述提问信息包括文本、音频以及图像中的一种或多种;基于所述提问信息,通过预先构建的问答模型进行文本生成,得到问答文本,其中,所述问答模型基于预设的多模态模型、向量索引以及大语言模型LLM构建得到。由此,对接收多种类型的用户提问,例如文本、音频以及图像,随后将提问信息输入预先由多模态模型、向量索引以及大语言模型LLM构建得到的问答模型进行文本生成,得到问答文本,解决了现有技术中问答模型无法对多种类型的信息如图像、音频以及文本等内容进行理解,导致回答效果不好的问题,提高了用户问答的准确性。
技术关键词
问答模型
问答方法
多模态
大语言模型
生成文本摘要
索引
图像
音频
数据
计算机程序产品
图片
问答装置
处理器
可读存储介质
布局
格式
存储器
颜色
系统为您推荐了相关专利信息
大语言模型
阅读方法
建立用户画像
阅读系统
数据
企业知识库
智能文档
大语言模型
生成提示词
生成文档
修井机电控系统
数据采集模块
多模态数据融合
分析模块
图像捕捉