一种生成大语言模型训练样本的方法和计算设备

AITNT
正文
推荐专利
一种生成大语言模型训练样本的方法和计算设备
申请号:CN202510121470
申请日期:2025-01-24
公开号:CN120893595A
公开日期:2025-11-04
类型:发明专利
摘要
一种生成大语言模型训练样本的方法和计算设备,获取原始语料样本,所述原始语料样本包括样本标签,根据所述原始语料样本,确定输入文本,所述输入文本包括任务指令、待分析文本、以及对所述样本标签对应的目标任务类型的指导说明,所述指导说明至少包括所述目标任务类型的标签提取示例,根据所述输入文本与所述样本标签,确定训练样本,可生成内容与样式更为丰富的训练样本,利用所生成的训练样本对大语言模型进行训练,可降低大语言模型的过拟合风险,在提升大语言模型针对一类子领域的分析能力的同时,提升大语言模型的通用NLU能力。
技术关键词
标签 大语言模型 样本 文本 指令 实体 数据格式 语句 存储器 处理器 样式 语义 嵌套 风险 关系
系统为您推荐了相关专利信息
1
一种面向工作场景的多模态智能终端交互方法
智能终端交互方法 时间序列特征 多模态 大语言模型 数据采集器
2
自移动设备的越障方法、脱困方法及相关设备
移动设备 驱动轮 障碍物 脱困方法 越障方法
3
一种基于电力行业本质的安全分析路径生成方法及系统
路径生成方法 本质 大语言模型 路径生成系统 数据
4
车辆故障检测方法、装置、电子设备及可读存储介质
车辆运行数据 车辆故障检测方法 文本 大语言模型 车辆故障检测装置
5
一种动态知识图谱构建方法、系统及设备
动态知识图谱 关键词 文本 实体间关系 企业内部管理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号