基于学术文献层级标题的指令自动化构建方法和装置

AITNT
正文
推荐专利
基于学术文献层级标题的指令自动化构建方法和装置
申请号:CN202410907055
申请日期:2024-07-08
公开号:CN118886400A
公开日期:2024-11-01
类型:发明专利
摘要
本申请提供了一种基于学术文献层级标题的指令自动化构建方法和装置、电子设备、存储介质及计算机程序产品,涉及人工智能领域。该方法通过生成式大语言模型对少量层级标题进行标注得到种子数据,然后依托于这些少量标注的种子数据,微调预设的基础大模型;使用微调得到的初始指令预测模型生成未标注层级标题所对应的指令数据,形成候选增强训练数据集合,再用模型评估数据质量,选择高质量数据组合种子数据对初始指令预测模型进行再训练,进一步迭代优化模型;采用迭代微调后的指令预测模型对测试层级标题进行预测,得到预测指令数据,进而确定最终的指令数据集,这些最终的指令数据集语义完整,质量高,能够满足高质量指令数据的需求。
技术关键词
层级 大语言模型 自动化构建方法 指令 数据获取单元 种子 样本 微调单元 计算机程序产品 文本 训练集 清洗单元 解析单元 电子设备 符号 基础 存储器 处理器 语义
系统为您推荐了相关专利信息
1
一种面向联合仿真试验的桌面应用系统
桌面容器 图像传输模块 共享存储模块 共享存储空间 封装模块
2
车位检测处理方法、装置、电子设备及存储介质
车体坐标系 地面 激光点云数据 位置偏差值 激光雷达
3
储能设备调度方法、装置、设备、存储介质及程序产品
储能设备 混合整数线性规划 策略 计算机执行指令 强化学习模型
4
一种壁挂炉控制器的控制方法以及壁挂炉控制器
壁挂炉控制器 语音识别单元 主控单元 控制电路 语音识别芯片
5
基于大语言模型的编译器后端生成增强方法及装置
大语言模型 信息显示设备 节点 生成代表 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号