摘要
本发明公开了一种混合专家大语言模型的融合问答方法、装置、设备及介质,涉及人工智能技术领域,该方法包括:将用户输入问题输入至预先训练的路由模型中,获取路由模型在N个专家模型中选出的k个用于回答用户输入问题的目标专家模型;通过k个目标专家模型对用户输入问题进行回答,并将各目标专家模型输出的专家答案进行融合后输出。通过路由模型筛选k个目标专家模型的答案并融合输出,模型的输出专注于与任务相关性较高的k个专家模型的结果,降低了资源消耗,加快响应时间并提高问答融合的效率。此外,融合来自不同任务领域的专家模型输出,不仅增强了模型的泛化能力,还提升了融合问答的可靠性。
技术关键词
问答方法
答案
训练样本集
多标签分类方法
大语言模型
计算机程序产品
指标
序列
可读存储介质
问答装置
人工智能技术
电子设备
处理器通信
输出模块
存储器
模版