模型推理方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
模型推理方法、装置、计算机设备及存储介质
申请号:CN202411996835
申请日期:2024-12-30
公开号:CN119886354A
公开日期:2025-04-25
类型:发明专利
摘要
本发明涉及人工智能技术领域,公开了模型推理方法、装置、计算机设备及存储介质,方法包括:接收多个推理请求,推理请求包括提示词;为各推理请求分配局部过滤缓存空间,局部过滤缓存空间用于存储局部过滤缓存值;获取各推理请求的局部过滤缓存空间中的局部过滤缓存值,对局部过滤缓存值进行拼接,获得拼接序列;利用大语言模型基于各推理请求的提示词和拼接序列进行多次推理,获得各推理请求的推理结果;在每次推理结束后,对各推理请求的局部过滤缓存空间中存储的局部过滤缓存值进行更新,以基于更新后的局部过滤缓存值进行下一次推理。本发明在高并发场景下,能够准确对推理请求进行推理,确保了推理结果的准确性。
技术关键词
大语言模型 序列 推理方法 注意力 计算机设备 推理装置 可读存储介质 标记 人工智能技术 存储器 处理器 指令 模块 场景
系统为您推荐了相关专利信息
1
基于策略网络的团体理赔方法、装置、设备及存储介质
理赔方法 决策 策略 网络 蒙特卡洛
2
一种API测试用例的生成方法和生成系统
身份验证信息 大语言模型 自然语言 模版 生成方法系统
3
一种基于多源异构数据融合的数字应急预案生成方法
应急预案生成方法 多源异构数据融合 融合规则 气象卫星遥感数据 物联网传感器数据
4
一种基于云边端的重卡换电站智能运维方法及运维云平台
巡检计划 换电站设备 智能运维方法 平台 工单管理
5
健康建议报告的生成方法、装置、计算机设备及存储介质
时序特征 医学知识库 生成方法 报告 标签
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号