摘要
本公开是关于一种数据处理方法、装置、设备、存储介质及程序产品,涉及人工智能技术领域,其中,该方法包括:通过预训练的大语言模型对输入文本信息进行处理,得到输出文本信息,在预训练大语言模型中的门控控制层包括路由模块,由路由模块选择门控控制层中的第一前馈神经网络或第二前馈神经网络进行数据处理,在同一个大语言模型中,通过不同的前馈神经网络分别对数据进行处理,充分的结合了不同的前馈神经网络的优势,避免了单一前馈神经网络在数据处理方面性能存在缺陷的问题,提高了大语言模型的上下文理解能力和嵌入能力,提升了大语言模型的性能,提高了大语言模型生成的文本信息的质量。
技术关键词
前馈神经网络
文本
数据处理方法
大语言模型
计算机程序产品
输入模块
处理器
数据处理装置
人工智能技术
注意力
指令
终端
电子设备
存储器
系统为您推荐了相关专利信息
回归预测模型
预测建模方法
大语言模型
数据
标签
智能查询方法
大语言模型
前台
智能查询系统
参数