一种文本的处理方法、产品、设备及介质

正文

推荐专利

一种文本的处理方法、产品、设备及介质

申请号：CN202410853486

申请日期：2024-06-28

公开号：CN118396126B

公开日期：2024-10-11

类型：发明专利

摘要

本发明公开了一种文本的处理方法、产品、设备及介质，涉及大语言模型技术领域。该方法中，为了将新知识融入到模型，该方法中在新知识适配器中利用注入的新知识样本进行训练，且在训练过程中保持大语言模型中的参数不变，即在已有的大语言模型的基础上仅对新知识适配器的参数进行训练。由于新知识适配器的参数是远远小于大语言模型中的参数，因此，能够高效、低算力、低成本地为大语言模型注入新的知识，又能保证大模型原本能力不遗忘，由于模型训练的效率提高，进而提高了使用该模型对文本推理时的效率；其次，使用新知识适配器和大语言模型对文本进行推理，保证了能够对新知识进行推理。

技术关键词

适配器大语言模型文本识别器前馈神经网络变换器样本变换编码器表达式可读存储介质存储计算机程序计算机程序产品子模块参数处理器同义词关键词低成本

系统为您推荐了相关专利信息

一种基于大语言模型的投诉处理方法及系统

大语言模型文本生成提示词关键词模板

一种钩臂式垃圾车自动吊装识别检测方法

钩臂式垃圾车识别检测方法整车控制单元自动泊车残差网络

基于锚点选择与图学习协同优化的单细胞多组学整合方法

锚点特异多层注意力机制基因数据

一种抑制大模型垂域微调过拟合的方法、装置及存储介质

参数矩阵分解技术深度学习优化大语言模型可读存储介质

文本内容生成方法、装置、介质、电子设备及程序产品

文本内容生成方法多媒体字段界面显示信息

一种文本的处理方法、产品、设备及介质

站点导航

APP 下载