基于学术文献层级标题的指令自动化构建方法和装置

正文

推荐专利

申请号：CN202410907055

申请日期：2024-07-08

公开号：CN118886400A

公开日期：2024-11-01

类型：发明专利

摘要

本申请提供了一种基于学术文献层级标题的指令自动化构建方法和装置、电子设备、存储介质及计算机程序产品，涉及人工智能领域。该方法通过生成式大语言模型对少量层级标题进行标注得到种子数据，然后依托于这些少量标注的种子数据，微调预设的基础大模型；使用微调得到的初始指令预测模型生成未标注层级标题所对应的指令数据，形成候选增强训练数据集合，再用模型评估数据质量，选择高质量数据组合种子数据对初始指令预测模型进行再训练，进一步迭代优化模型；采用迭代微调后的指令预测模型对测试层级标题进行预测，得到预测指令数据，进而确定最终的指令数据集，这些最终的指令数据集语义完整，质量高，能够满足高质量指令数据的需求。

技术关键词

层级大语言模型自动化构建方法指令数据获取单元种子样本微调单元计算机程序产品文本训练集清洗单元解析单元电子设备符号基础存储器处理器语义

系统为您推荐了相关专利信息

一种面向联合仿真试验的桌面应用系统

桌面容器图像传输模块共享存储模块共享存储空间封装模块

车位检测处理方法、装置、电子设备及存储介质

车体坐标系地面激光点云数据位置偏差值激光雷达

储能设备调度方法、装置、设备、存储介质及程序产品

储能设备混合整数线性规划策略计算机执行指令强化学习模型

一种壁挂炉控制器的控制方法以及壁挂炉控制器

壁挂炉控制器语音识别单元主控单元控制电路语音识别芯片

基于大语言模型的编译器后端生成增强方法及装置

大语言模型信息显示设备节点生成代表文本

基于学术文献层级标题的指令自动化构建方法和装置

站点导航

APP 下载