基于大语言模型的自动化长文本微调指令集构建方法

正文

推荐专利

申请号：CN202510119646

申请日期：2025-01-24

公开号：CN120181045A

公开日期：2025-06-20

类型：发明专利

摘要

本发明提供一种基于大语言模型的自动化长文本微调指令集构建方法，包括：获取输入文本，采用递归字符分割法对输入文本进行分割，生成段落集合；针对生成的段落集合，大语言模型根据任务类型通过预设的问题类型集合和提示模板，采用自我指导学习方法生成问题集合和答案集合；基于生成的问题集合和答案集合生成指令集，多维度评估指令集的质量，根据评估结果对指令集进行优化得到优化后的指令集。本发明能够自动生成高质量的长文本微调指令集，以提高大语言模型的性能，同时解决长上下文处理的挑战。通过自动化构建长文本微调指令集，减少了人工标注的需求，降低了成本，同时提高了微调过程的效率和模型的长文本处理能力。

技术关键词

大语言模型文本段落学习方法模板生成答案种子非暂态计算机可读存储介质字符处理器切割模块计算机程序产品分段存储器定义电子设备指令

系统为您推荐了相关专利信息

一种检测汉坦病毒的试剂盒及其检测方法

检测汉坦病毒试剂盒引物探针组模板样本

一种基于深度学习的医疗数据分类方法及分类系统

医疗数据分类方法医疗数据分类模型支持向量机模型逻辑回归模型 PCA算法

一种基于机器学习的芯片DFN封装与工艺协同优化方法

DFN封装结构协同优化方法机器学习方法曲线信噪比

微网系统的电力控制方法、设备、系统及存储介质

微网系统时间序列模型电力控制方法神经网络模型电力控制设备

一种基于大语言模型的文档标签生成方法

大语言模型标签生成方法文本生成标签标签匹配方法

基于大语言模型的自动化长文本微调指令集构建方法

站点导航

APP 下载