摘要
一种生成大语言模型训练样本的方法和计算设备,获取原始语料样本,所述原始语料样本包括样本标签,根据所述原始语料样本,确定输入文本,所述输入文本包括任务指令、待分析文本、以及对所述样本标签对应的目标任务类型的指导说明,所述指导说明至少包括所述目标任务类型的标签提取示例,根据所述输入文本与所述样本标签,确定训练样本,可生成内容与样式更为丰富的训练样本,利用所生成的训练样本对大语言模型进行训练,可降低大语言模型的过拟合风险,在提升大语言模型针对一类子领域的分析能力的同时,提升大语言模型的通用NLU能力。
技术关键词
标签
大语言模型
样本
文本
指令
实体
数据格式
语句
存储器
处理器
样式
语义
嵌套
风险
关系
系统为您推荐了相关专利信息
智能终端交互方法
时间序列特征
多模态
大语言模型
数据采集器
路径生成方法
本质
大语言模型
路径生成系统
数据
车辆运行数据
车辆故障检测方法
文本
大语言模型
车辆故障检测装置
动态知识图谱
关键词
文本
实体间关系
企业内部管理