一种基于空闲时间预计算的大语言模型推理方法、系统、装置及介质

AITNT
正文
推荐专利
一种基于空闲时间预计算的大语言模型推理方法、系统、装置及介质
申请号:CN202510721938
申请日期:2025-05-30
公开号:CN120579637A
公开日期:2025-09-02
类型:发明专利
摘要
本申请涉及人工智能技术领域,涉及一种基于空闲时间预计算的大语言模型推理方法、系统、装置及介质。所述方法包括:在用户查询到达前且无实时查询处理的空闲时间阶段,获取与潜在用户查询相关的上下文信息;利用大型语言模型对所述上下文信息执行预计算处理,生成增强上下文表示;在测试时间阶段接收用户查询;基于所述增强上下文表示和用户查询,利用大型语言模型执行测试时间计算以生成响应。本发明通过在用户查询前利用空闲时间预计算上下文,显著减少了测试时间所需的计算量,提高了计算资源的利用效率。
技术关键词
推理方法 推理系统 阶段 推理装置 人工智能技术 模块 处理器 多路径 可读存储介质 程序 指令 实体 存储器 计算机 策略 精度 关系
系统为您推荐了相关专利信息
1
一种基于故障机理仿真和数据融合的高速铣齿机主轴箱故障诊断方法及系统
主轴箱系统 故障诊断方法 铣齿机 故障诊断模型 振动加速度传感器
2
基于类增量学习的图像分类模型及其训练方法、分类方法
图像分类模型 辅助分类器 特征提取器 阶段 生成特征
3
一种岩石裂隙识别与扩展预测方法及系统
空间特征参数 卷积神经网络训练 CT扫描 切片 GCN模型
4
凝视点引导的儿童视觉认知分类方法、系统及设备
视觉 样本 眼动数据 分类方法 语义
5
一种通过AI模型诊断液压机系统故障的方法
液压机系统 样本 液压系统运行状态 故障类别 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号