模型推理方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411996835

申请日期：2024-12-30

公开号：CN119886354A

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了模型推理方法、装置、计算机设备及存储介质，方法包括：接收多个推理请求，推理请求包括提示词；为各推理请求分配局部过滤缓存空间，局部过滤缓存空间用于存储局部过滤缓存值；获取各推理请求的局部过滤缓存空间中的局部过滤缓存值，对局部过滤缓存值进行拼接，获得拼接序列；利用大语言模型基于各推理请求的提示词和拼接序列进行多次推理，获得各推理请求的推理结果；在每次推理结束后，对各推理请求的局部过滤缓存空间中存储的局部过滤缓存值进行更新，以基于更新后的局部过滤缓存值进行下一次推理。本发明在高并发场景下，能够准确对推理请求进行推理，确保了推理结果的准确性。

技术关键词

大语言模型序列推理方法注意力计算机设备推理装置可读存储介质标记人工智能技术存储器处理器指令模块场景

系统为您推荐了相关专利信息

基于策略网络的团体理赔方法、装置、设备及存储介质

理赔方法决策策略网络蒙特卡洛

一种API测试用例的生成方法和生成系统

身份验证信息大语言模型自然语言模版生成方法系统

一种基于多源异构数据融合的数字应急预案生成方法

应急预案生成方法多源异构数据融合融合规则气象卫星遥感数据物联网传感器数据

一种基于云边端的重卡换电站智能运维方法及运维云平台

巡检计划换电站设备智能运维方法平台工单管理

健康建议报告的生成方法、装置、计算机设备及存储介质

时序特征医学知识库生成方法报告标签

模型推理方法、装置、计算机设备及存储介质

站点导航

APP 下载