摘要
本申请公开了一种语言模型推理方法、装置、计算机设备及存储介质,涉及计算机技术领域,包括实时监控语言模型推理过程中的推理性能信息并可视化显示;获取推理性能信息类型,基于推理性能信息类型以及推理性能信息确定推理评估体系,确定推理评估体系中的各个主评估指标的综合评分,进行更新推理策略,推理策略包括多个推理请求的数量以及处理顺序,解决了同时处理的推理请求数量过多造成的系统性能下降的技术问题,达到了提高推理准确性、稳定性的技术效果。
技术关键词
指标
推理方法
文本
执行语言模型
计算机设备
策略
推理装置
可读存储介质
存储计算机程序
数据
处理器
频率
监控模块
元素
存储器
系统为您推荐了相关专利信息
辅助决策方法
模糊综合评价
燃气轮机
循环神经网络模型
灰色关联度
合规性检测方法
综合语义
BiLSTM模型
多模态特征
文本
免疫检查点抑制剂
组学特征
语义特征
灰度共生矩阵
间质性肺病