一种基于动态top-k选择专家模型的文本常识推理方法

正文

推荐专利

申请号：CN202510999303

申请日期：2025-07-21

公开号：CN120875042A

公开日期：2025-10-31

类型：发明专利

摘要

本发明主要提出了一种基于动态top‑k选择专家模型的文本常识推理方法，包括数据集构建方法、模型训练方法以及模型推理方法，使得模型推理过程中能够达到更低的显存使用量和更好的模型输出效果，让模型在更低的资源消耗下表现得更加智能。具体而言，需要先获取不同的文本数据并加以分析、识别形成数据集；在训练模型时额外指定loss使得模型能够实现负载均衡等能力；使用强化学习的思想确定每一层需要调用的专家数目(k值)；最后基于该动态分配专家的方法设计模型推理步骤。

技术关键词

数据集构建方法动态依存句法分析自然语言文本模型训练方法文本编码器爬虫爬取推理方法信息编码注意力机制遗传算法标签序列分词社交媒体语义

一种基于动态top-k选择专家模型的文本常识推理方法

站点导航

APP 下载