摘要
本发明公开了一种基于混合专家模型的文本数据推理方法及装置,用于解决现有的基于混合专家模型的推理过程导致推理效率低的技术问题。方法包括获取预运行文本数据集;在多级异构内存空间中将预运行文本数据集输入至预置混合专家模型进行预运行推理,确定混合专家模块计算传输时间和专家相关性表;基于专家相关性表和预置预取热门专家数量,对预置混合专家模型进行热门专家识别,确定多个目标混合专家模块;采用预置约束感知策划不等式根据预置预取热门专家数量、混合专家模块计算传输时间,确定输入文本批次数量;在多级异构内存空间中,采用各目标混合专家模块根据输入文本批次数量对应的待推理文本数据子集,输出模型推理结果。
技术关键词
数据推理方法
文本
异构
计算机程序产品
推理装置
可读存储介质
硬盘
频率
内存
注意力机制
处理器
计算机设备
识别模块
存储器
指令
系统为您推荐了相关专利信息
深度学习网络模型
智能推荐方法
挖泥船作业
疏浚作业
参数
广告投放平台
广告推荐方法
图像特征向量
视频特征向量
广告互动
动态知识图谱
国土空间规划
动态监测方法
规划知识库
多源异构数据