摘要
本申请实施例提供一种推理请求处理方法、电子装置、介质和计算机程序产品,通过获取至少一条第一请求消息;对所述至少一条第一请求消息进行语义特征提取,得到所述至少一条第一请求信息分别对应的第一语义向量;基于所述至少一条第一请求信息分别对应的第一语义向量,结合语义相似度匹配方法和分类方法,将所述至少一条第一请求消息分别调度到对应的目标推理节点;基于预加载的多级前缀缓存机制对各个目标推理节点的第一请求消息进行推理,得到所述至少一条第一请求消息分别对应的目标推理结果,也就是,在多个用户请求分别对应的推理节点提前加载前缀数据,减少了请求延迟,并采用多级缓存存储前缀数据,从而,提高了推理效率。
技术关键词
语义向量
消息
预加载机制
缓存机制
分类方法
节点
语义特征提取
计算机程序产品
分布式缓存系统
电子装置
数据存储
上存储计算机程序
处理器
可读存储介质
指令
频率
分类网络
存储器
系统为您推荐了相关专利信息
粒子群算法
网络流量调度
策略
计算机网络安全技术
决策
事件分类方法
分类网络
波形特征提取
特征提取网络
地震数据处理技术
模型训练方法
循环神经网络模型
语义向量
实体
跨度