摘要
本申请实施例提供了一种大语言模型构建方法、文本处理方法、系统、设备及介质,属于人工智能技术领域。该方法通过训练数据集对文本处理基础模型的所有网络层进行训练得到第一语言模型,然后对第一语言模型的所有网络层进行划分,前部分的若干个网络层作为共享网络,后部分的若干个网络层作为专家网络。通过各个领域文本子集分别训练第一语言模型的专家网络,得到各个能够处理特定领域特征的领域专家网络,通过路由器模块连接共享网络和各个领域专家网络得到第二语言模型,然后对第二语言模型进行训练得到用于文本处理的大语言模型,使得路由器模块能够选择合适的领域专家网络处理相应的输入特征,提高大语言模型对各种领域文本处理的准确性。
技术关键词
语言模型构建方法
文本处理方法
大语言模型
路由器
网络
模块
基础
处理器
人工智能技术
构建系统
输出端
电子设备
数据总线
输出特征
存储器
程序
输入端
可读存储介质
系统为您推荐了相关专利信息
自然语言
任务调度执行
自主系统
专业
计算机可执行指令
网络流量数据
计算方法
链路
网络设备管理协议
强化学习算法
精准诊疗系统
多模态数据融合
多模态深度学习
卷积神经网络提取特征
交互式数据可视化
管理软件
积分管理系统
资产
验证机制
区块链技术
新能源发电站
光伏消纳预测预警方法
历史气象数据
发电量
电力系统