基于多模态大模型的对话方法、装置、设备以及存储介质

正文

推荐专利

申请号：CN202510918795

申请日期：2025-07-03

公开号：CN120448507B

公开日期：2025-09-05

类型：发明专利

摘要

本公开提供了一种基于多模态大模型的对话方法、装置、设备以及存储介质。本公开涉及计算机技术领域，尤其涉及深度学习、大语言模型、问答系统、家装设计软件等技术领域。该方法包括：响应于前端界面的对话操作，获取输入的原始查询文本和前端界面的界面图片；利用视觉大语言模型，根据界面图片中包含的视觉信息，对原始查询文本进行改写，得到增强查询文本；根据原始查询文本和增强查询文本，在向量数据库中检索得到外部知识结果；将增强查询文本和外部知识结果输入问答模型，得到回答文本。根据本公开的方案，可以结合用户的文本输入和实时的操作界面视觉信息，更深刻地理解用户意图，从而提供更加精准、有效的回答。

技术关键词

界面图片文本大语言模型对话方法问答模型视觉多模态家装设计软件 YOLO模型异常状态设计主体模块对话装置意图问答系统计算机程序产品处理器通信

系统为您推荐了相关专利信息

电力系统源荷预测方法及相关装置

电力系统变量归一化模块预测系统多层感知机

产品推荐方法、装置、电子设备及存储介质

映射关系表隐性特征产品推荐方法特征提取系统数据

考虑多粒度语义对齐的多模态人体大模型训练方法及系统

模型训练方法语义多模态人体特征编码器参数

基于文本增强和动态多模态匹配的食品图像分类方法

食品图像分类多模态文本编码器融合特征交叉注意力机制

视频内容推理方法、装置和系统

时空定位模块时序解析器图像视频

基于多模态大模型的对话方法、装置、设备以及存储介质

站点导航

APP 下载