一种自动实现大语言模型微调的装置及方法

AITNT
正文
推荐专利
一种自动实现大语言模型微调的装置及方法
申请号:CN202410981185
申请日期:2024-07-22
公开号:CN118821886A
公开日期:2024-10-22
类型:发明专利
摘要
本发明涉及一种自动实现大语言模型微调的装置及方法,其装置包括:数据预处理模块,通过数据接口与外部原始数据源连接,将清洗、标注和格式化后的数据传递给模型加载模块;模型加载模块,连接到存储介质以获取预训练模型,并将加载的模型传递给训练管理模块;训练管理模块,接收训练数据和模型参数,同时传递训练过程中的中间结果和最终模型;性能评估模块,连接到训练管理模块,接收训练结果,并将性能指标反馈给自动化调整模块;自动化调整模块,根据性能评估模块的反馈结果,自动调整模型的超参数和训练策略;本发明实现了大语言模型微调过程的高度自动化和智能化,显著提高了数据预处理和模型训练的效率,缩短了整体微调时间。
技术关键词
内部总线接口 子模块 数据格式 预训练模型 深度学习框架 大语言模型 策略 格式化 超参数 数据接口 指标 冗余 日志 标签 噪声 误差
系统为您推荐了相关专利信息
1
基于深度卷积神经网络的儿童肺炎病因分型系统
儿童肺炎 深度卷积神经网络 分型系统 影像 指标
2
一种故障预测与健康管理系统
故障预测模型 健康管理系统 历史故障数据 数据收集模块 数据录入系统
3
一种面向单域不平衡数据的滚动轴承故障诊断方法
滚动轴承故障诊断方法 数据 故障特征 分支 工况特征
4
面部图像识别方法、装置、电子设备及存储介质
脉冲神经网络模型 面部图像识别方法 图像识别模型 脉冲生成模块 卷积神经网络模型
5
一种线圈骨架分离式无框电机以及机器人
绕线骨架 线圈骨架 转子模块 定子座 定子盖
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号