大模型部署方法及其装置

AITNT
正文
推荐专利
大模型部署方法及其装置
申请号:CN202411074975
申请日期:2024-08-07
公开号:CN118607643B
公开日期:2024-11-26
类型:发明专利
摘要
本发明提供了一种大模型部署方法及其装置。该方法包括:接收在第N次问答交互时用户输入的待解答问题;基于第一大模型集中每个大模型回答问题的预估准确度,从第一大模型集中筛选K个大模型,得到第二大模型集;在确定缓存中不存在待解答问题,或缓存中存在待解答问题且与待解答问题对应的答案不满足用户需求时,基于调用第二大模型集中大模型各自回答问题时所需消耗的预估资源,对第二大模型集中每个大模型进行排序,得到第三大模型集;按照排序从第三大模型集中依次确定目标大模型,直至目标答案满足用户的需求或第三大模型集中K个大模型输出的目标答案均不满足用户的需求时,停止从第三大模型集中确定目标大模型,完成第N次问答交互。
技术关键词
答案 模型部署方法 资源 时间段 模块 参数
系统为您推荐了相关专利信息
1
深度学习工作负载的调度方法、装置及电子设备
阶段 非易失性存储介质 集群 元素 模型超参数
2
一种血液病智能诊疗数据处理系统
诊疗数据处理系统 多层次特征提取 融合特征 信息模块 核心
3
融合情感和证据的多模态虚假信息检测方法及系统
虚假信息检测方法 交叉注意力机制 情感特征 情感识别模型 文本
4
基于模型的人工智能实时新闻推荐系统
新闻推荐系统 协同过滤算法 关键词 结构化数据格式 模型训练模块
5
问答方法、相关设备及计算机程序产品
问答方法 问答系统 融合特征 计算机程序产品 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号