大语言模型的训练方法、装置、计算机设备和存储介质

正文

推荐专利

申请号：CN202411955451

申请日期：2024-12-28

公开号：CN119783853A

公开日期：2025-04-08

类型：发明专利

摘要

本申请涉及一种大语言模型的训练方法、装置、计算机设备和存储介质。所述方法包括：获取原始回答文本数据；去除原始回答文本数据中的第一回答文本数据，得到第二回答文本数据；第一回答文本数据为包括目标语言单元的回答文本；目标语言单元为用于表达拒绝回答语义的语言单元；去除第二回答文本数据中的第三回答文本数据，得到第四回答文本数据；第三回答文本数据为通过预训练的第一大语言模型识别出的含有拒绝回答意图的回答文本；采用包含有第四回答文本数据的训练样本数据对待训练的第二大语言模型训练，得到目标大语言模型。采用本方法能够解决大语言模型在面对用户的提问时输出的回答文本具有局限性的问题。

技术关键词

大语言模型数据生成模型文本训练样本数据计算机设备意图计算机程序产品处理器语义训练装置可读存储介质规模指令模块存储器参数场景

系统为您推荐了相关专利信息

电网调控运行规程文件知识表征建模方法、系统及设备

序列标注模型建模方法条件随机场数据建模系统

一种用于商品更换背景的方法、装置、设备和介质

大语言模型生成场景抠图算法图片矩阵

权限处理方法、装置、计算机设备及存储介质

验证规则业务系统策略执行访问控制计算机可读指令

一种基于选择性状态空间融合的眼科影像分类方法

影像分类方法医学影像数据小波多尺度眼科特征提取器

基于大语言模型与推测算法协同的建表方法及装置

大语言模型统计特征样本表头标识

大语言模型的训练方法、装置、计算机设备和存储介质

站点导航

APP 下载