摘要
本发明提供了一种大模型部署方法及其装置。该方法包括:接收在第N次问答交互时用户输入的待解答问题;基于第一大模型集中每个大模型回答问题的预估准确度,从第一大模型集中筛选K个大模型,得到第二大模型集;在确定缓存中不存在待解答问题,或缓存中存在待解答问题且与待解答问题对应的答案不满足用户需求时,基于调用第二大模型集中大模型各自回答问题时所需消耗的预估资源,对第二大模型集中每个大模型进行排序,得到第三大模型集;按照排序从第三大模型集中依次确定目标大模型,直至目标答案满足用户的需求或第三大模型集中K个大模型输出的目标答案均不满足用户的需求时,停止从第三大模型集中确定目标大模型,完成第N次问答交互。
技术关键词
答案
模型部署方法
资源
时间段
模块
参数
系统为您推荐了相关专利信息
诊疗数据处理系统
多层次特征提取
融合特征
信息模块
核心
虚假信息检测方法
交叉注意力机制
情感特征
情感识别模型
文本
新闻推荐系统
协同过滤算法
关键词
结构化数据格式
模型训练模块
问答方法
问答系统
融合特征
计算机程序产品
多模态