推理请求处理方法、电子装置、介质和计算机程序产品

AITNT
正文
推荐专利
推理请求处理方法、电子装置、介质和计算机程序产品
申请号:CN202510933256
申请日期:2025-07-07
公开号:CN120875029A
公开日期:2025-10-31
类型:发明专利
摘要
本申请实施例提供一种推理请求处理方法、电子装置、介质和计算机程序产品,通过获取至少一条第一请求消息;对所述至少一条第一请求消息进行语义特征提取,得到所述至少一条第一请求信息分别对应的第一语义向量;基于所述至少一条第一请求信息分别对应的第一语义向量,结合语义相似度匹配方法和分类方法,将所述至少一条第一请求消息分别调度到对应的目标推理节点;基于预加载的多级前缀缓存机制对各个目标推理节点的第一请求消息进行推理,得到所述至少一条第一请求消息分别对应的目标推理结果,也就是,在多个用户请求分别对应的推理节点提前加载前缀数据,减少了请求延迟,并采用多级缓存存储前缀数据,从而,提高了推理效率。
技术关键词
语义向量 消息 预加载机制 缓存机制 分类方法 节点 语义特征提取 计算机程序产品 分布式缓存系统 电子装置 数据存储 上存储计算机程序 处理器 可读存储介质 指令 频率 分类网络 存储器
系统为您推荐了相关专利信息
1
一种基于公私网互通的路由表建立方法及装置
网络节点 接口 路由表建立方法 报文 消息
2
一种基于粒子群算法的安全服务链自动编排部署方法
粒子群算法 网络流量调度 策略 计算机网络安全技术 决策
3
一种基于多特征融合的深度学习地震事件分类方法及系统
事件分类方法 分类网络 波形特征提取 特征提取网络 地震数据处理技术
4
一种大语言模型的管理系统
大语言模型 集群 管理系统 日志推送 日志解析
5
工程安全设计文档可视化审查模型训练方法
模型训练方法 循环神经网络模型 语义向量 实体 跨度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号