大语言模型构建方法、文本处理方法、系统、设备及介质

AITNT
正文
推荐专利
大语言模型构建方法、文本处理方法、系统、设备及介质
申请号:CN202410895698
申请日期:2024-07-04
公开号:CN118798258A
公开日期:2024-10-18
类型:发明专利
摘要
本申请实施例提供了一种大语言模型构建方法、文本处理方法、系统、设备及介质,属于人工智能技术领域。该方法通过训练数据集对文本处理基础模型的所有网络层进行训练得到第一语言模型,然后对第一语言模型的所有网络层进行划分,前部分的若干个网络层作为共享网络,后部分的若干个网络层作为专家网络。通过各个领域文本子集分别训练第一语言模型的专家网络,得到各个能够处理特定领域特征的领域专家网络,通过路由器模块连接共享网络和各个领域专家网络得到第二语言模型,然后对第二语言模型进行训练得到用于文本处理的大语言模型,使得路由器模块能够选择合适的领域专家网络处理相应的输入特征,提高大语言模型对各种领域文本处理的准确性。
技术关键词
语言模型构建方法 文本处理方法 大语言模型 路由器 网络 模块 基础 处理器 人工智能技术 构建系统 输出端 电子设备 数据总线 输出特征 存储器 程序 输入端 可读存储介质
系统为您推荐了相关专利信息
1
基于大语言模型的多智能体协同方法、装置、设备及介质
自然语言 任务调度执行 自主系统 专业 计算机可执行指令
2
一种基于异常链路识别的自动化处理工具的计算方法
网络流量数据 计算方法 链路 网络设备管理协议 强化学习算法
3
一种基于大数据的肝癌患者诊断数据检索精准诊疗系统
精准诊疗系统 多模态数据融合 多模态深度学习 卷积神经网络提取特征 交互式数据可视化
4
一种区块链Filecoin钱包管理软件
管理软件 积分管理系统 资产 验证机制 区块链技术
5
一种风电和光伏消纳预测预警方法及装置
新能源发电站 光伏消纳预测预警方法 历史气象数据 发电量 电力系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号