混合专家大语言模型的融合问答方法、装置、设备及介质

正文

推荐专利

申请号：CN202411857662

申请日期：2024-12-17

公开号：CN119692477A

公开日期：2025-03-25

类型：发明专利

摘要

本发明公开了一种混合专家大语言模型的融合问答方法、装置、设备及介质，涉及人工智能技术领域，该方法包括：将用户输入问题输入至预先训练的路由模型中，获取路由模型在N个专家模型中选出的k个用于回答用户输入问题的目标专家模型；通过k个目标专家模型对用户输入问题进行回答，并将各目标专家模型输出的专家答案进行融合后输出。通过路由模型筛选k个目标专家模型的答案并融合输出，模型的输出专注于与任务相关性较高的k个专家模型的结果，降低了资源消耗，加快响应时间并提高问答融合的效率。此外，融合来自不同任务领域的专家模型输出，不仅增强了模型的泛化能力，还提升了融合问答的可靠性。

技术关键词

问答方法答案训练样本集多标签分类方法大语言模型计算机程序产品指标序列可读存储介质问答装置人工智能技术电子设备处理器通信输出模块存储器模版

混合专家大语言模型的融合问答方法、装置、设备及介质

站点导航

APP 下载