一种生成大语言模型训练样本的方法和计算设备

正文

推荐专利

申请号：CN202510121470

申请日期：2025-01-24

公开号：CN120893595A

公开日期：2025-11-04

类型：发明专利

摘要

一种生成大语言模型训练样本的方法和计算设备，获取原始语料样本，所述原始语料样本包括样本标签，根据所述原始语料样本，确定输入文本，所述输入文本包括任务指令、待分析文本、以及对所述样本标签对应的目标任务类型的指导说明，所述指导说明至少包括所述目标任务类型的标签提取示例，根据所述输入文本与所述样本标签，确定训练样本，可生成内容与样式更为丰富的训练样本，利用所生成的训练样本对大语言模型进行训练，可降低大语言模型的过拟合风险，在提升大语言模型针对一类子领域的分析能力的同时，提升大语言模型的通用NLU能力。

技术关键词

标签大语言模型样本文本指令实体数据格式语句存储器处理器样式语义嵌套风险关系

系统为您推荐了相关专利信息

一种面向工作场景的多模态智能终端交互方法

智能终端交互方法时间序列特征多模态大语言模型数据采集器

自移动设备的越障方法、脱困方法及相关设备

移动设备驱动轮障碍物脱困方法越障方法

一种基于电力行业本质的安全分析路径生成方法及系统

路径生成方法本质大语言模型路径生成系统数据

车辆故障检测方法、装置、电子设备及可读存储介质

车辆运行数据车辆故障检测方法文本大语言模型车辆故障检测装置

一种动态知识图谱构建方法、系统及设备

动态知识图谱关键词文本实体间关系企业内部管理

一种生成大语言模型训练样本的方法和计算设备

站点导航

APP 下载