摘要
本申请涉及人工智能技术领域,涉及一种基于空闲时间预计算的大语言模型推理方法、系统、装置及介质。所述方法包括:在用户查询到达前且无实时查询处理的空闲时间阶段,获取与潜在用户查询相关的上下文信息;利用大型语言模型对所述上下文信息执行预计算处理,生成增强上下文表示;在测试时间阶段接收用户查询;基于所述增强上下文表示和用户查询,利用大型语言模型执行测试时间计算以生成响应。本发明通过在用户查询前利用空闲时间预计算上下文,显著减少了测试时间所需的计算量,提高了计算资源的利用效率。
技术关键词
推理方法
推理系统
阶段
推理装置
人工智能技术
模块
处理器
多路径
可读存储介质
程序
指令
实体
存储器
计算机
策略
精度
关系
系统为您推荐了相关专利信息
主轴箱系统
故障诊断方法
铣齿机
故障诊断模型
振动加速度传感器
图像分类模型
辅助分类器
特征提取器
阶段
生成特征
空间特征参数
卷积神经网络训练
CT扫描
切片
GCN模型
液压机系统
样本
液压系统运行状态
故障类别
节点