混合专家语言模型优化方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202410847171

申请日期：2024-06-27

公开号：CN118673992A

公开日期：2024-09-20

类型：发明专利

摘要

本申请涉及大语言模型技术领域，特别涉及一种混合专家语言模型优化方法、装置、设备、介质及产品，其中，方法包括：获取混合专家语言模型的下游任务训练集；根据下游任务训练集进化搜索混合专家语言模型中专家模型的需要保留数量和需要激活数量；根据需要保留数量和需要激活数量的至少一个优化混合专家语言模型，其中，根据需要保留数量降低专家模型的总数量，根据需要激活数量降低专家模型的激活数量。由此，解决了相关技术中对于混合专家语言模型的优化，导致优化后的混合专家语言模型的性能受限等问题。

技术关键词

语言模型优化方法训练集矩阵大语言模型计算机程序产品搜索模块优化装置处理器指令可读存储介质存储器元素阶段电子设备受限网络

系统为您推荐了相关专利信息

一种智能音乐空间系统

分系统智能体感音乐智能灯光控制平台

基于思维链提示的多跨度问答认知匹配方法及系统

答案跨度大语言模型线索语义结构

基于空地多源数据的城市级实景三维建模方法

实景三维建模方法融合多模态特征倾斜摄影模型语义标签地面

一种可研报告生成方法及系统

报告生成方法报告生成系统大语言模型电力行业数据模板

小波变化的弱光图像增强方法

弱光图像增强方法神经网络框架模块神经网络模型设计特征

混合专家语言模型优化方法、装置、设备、介质及产品

站点导航

APP 下载