大语言模型构建方法、文本处理方法、系统、设备及介质

正文

推荐专利

申请号：CN202410895698

申请日期：2024-07-04

公开号：CN118798258A

公开日期：2024-10-18

类型：发明专利

摘要

本申请实施例提供了一种大语言模型构建方法、文本处理方法、系统、设备及介质，属于人工智能技术领域。该方法通过训练数据集对文本处理基础模型的所有网络层进行训练得到第一语言模型，然后对第一语言模型的所有网络层进行划分，前部分的若干个网络层作为共享网络，后部分的若干个网络层作为专家网络。通过各个领域文本子集分别训练第一语言模型的专家网络，得到各个能够处理特定领域特征的领域专家网络，通过路由器模块连接共享网络和各个领域专家网络得到第二语言模型，然后对第二语言模型进行训练得到用于文本处理的大语言模型，使得路由器模块能够选择合适的领域专家网络处理相应的输入特征，提高大语言模型对各种领域文本处理的准确性。

技术关键词

语言模型构建方法文本处理方法大语言模型路由器网络模块基础处理器人工智能技术构建系统输出端电子设备数据总线输出特征存储器程序输入端可读存储介质

系统为您推荐了相关专利信息

基于大语言模型的多智能体协同方法、装置、设备及介质

自然语言任务调度执行自主系统专业计算机可执行指令

一种基于异常链路识别的自动化处理工具的计算方法

网络流量数据计算方法链路网络设备管理协议强化学习算法

一种基于大数据的肝癌患者诊断数据检索精准诊疗系统

精准诊疗系统多模态数据融合多模态深度学习卷积神经网络提取特征交互式数据可视化

一种区块链Filecoin钱包管理软件

管理软件积分管理系统资产验证机制区块链技术

一种风电和光伏消纳预测预警方法及装置

新能源发电站光伏消纳预测预警方法历史气象数据发电量电力系统

大语言模型构建方法、文本处理方法、系统、设备及介质

站点导航

APP 下载