数据合成方法、模型预训练方法、装置、介质及设备

AITNT
正文
推荐专利
数据合成方法、模型预训练方法、装置、介质及设备
申请号:CN202411821931
申请日期:2024-12-11
公开号:CN119862269A
公开日期:2025-04-22
类型:发明专利
摘要
本申请实施例提供了一种数据合成方法、模型预训练方法、数据合成装置、计算机可读存储介质以及电子设备,涉及人工智能技术领域。该方法包括:将目标预训练模型对应的目标任务进行拆分,得到多个子任务;根据种子数据集中的种子数据,确定提示词,其中,种子数据集中数据为从多种渠道收集的关于目标任务的数据,提示词为子任务对应的提示词或者为目标任务对应的提示词,提示词的样式包括多种;将提示词输入大语言模型,其中,该大语言模型为经过训练的模型,且该模型输出的生成数据对应于上述提示词;根据上述生成数据,确定关于目标任务的合成数据。本申请实施例能够提供大规模且高质量的合成数据,有利于满足预训练对大规模高质量数据的需求。
技术关键词
数据 大语言模型 种子 预训练模型 预训练方法 纠错 存储计算机程序 样式 可读存储介质 人工智能技术 渠道 电子设备 知识点 模块 存储器 处理器 话题 答案 风格
系统为您推荐了相关专利信息
1
基于大数据的企业商旅定制规划方法及系统
意图 协同过滤推荐算法 大数据 客户 规划
2
基于遥感数据识别光伏阵列安装质量的方法
光伏阵列 识别光伏 数字地表模型 数据 遥感检测技术
3
一种基于机器视觉的废钢料堆库存变动检测方法
多层卷积神经网络 图像金字塔 双边滤波算法 残差模块 直方图均衡化
4
一种动力电池SOC估算系统及方法
滤波模块 混合深度学习模型 电池管理系统 融合滤波 驱动电流值
5
一种基于大模型的人物知识图谱复杂问答推理的智能体方法
字符串模糊匹配 大语言模型 实体 图谱 答案
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号