一种推理方法及系统、电子设备、存储介质

AITNT
正文
推荐专利
一种推理方法及系统、电子设备、存储介质
申请号:CN202411917100
申请日期:2024-12-23
公开号:CN119990307A
公开日期:2025-05-13
类型:发明专利
摘要
本申请实施例涉及人工智能技术领域,公开了一种推理方法及系统、电子设备、存储介质。推理方法,包括:接收用户请求,其中,所述用户请求携带输入信息;根据所述输入信息,在第一缓存中进行匹配;基于所述第二缓存,将匹配到的token序列及其KV参数、所述输入信息传递至第三缓存,以使推理模型基于所述第三缓存进行推理计算,并将推理得到的token序列及其KV参数传递至所述第一缓存进行存储。至少有利于减少推理过程中的数据传输开销和成本,以进一步提高推理效率。
技术关键词
推理方法 参数 序列 集群 推理系统 数据传输开销 电子设备 人工智能技术 处理器通信 可读存储介质 主机 存储器 指令 计算机
系统为您推荐了相关专利信息
1
一种火电厂SCR脱硝系统出口NOx浓度预测方法及系统
NOx浓度预测方法 SCR脱硝系统 LSTM模型 超参数 历史运行数据
2
一种食管鳞癌诊断相关环状RNA分子标志物及其应用
食管鳞癌诊断 标志物 食管鳞癌患者 核苷酸 食管鳞癌辅助诊断
3
一种基于深度时序建模的情绪评估方法及装置
情绪评估方法 梅尔频率倒谱系数 语音 电信号 序列
4
基于虚拟标定车间的自动驾驶相机标定方法及系统
相机标定方法 标定板图像 车间 图像分割网络 搜索算法
5
基于自适应补偿机制的随机计算处理单元及方法
处理单元 系数乘法器 符号 比特流 轻量级神经网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号