大语言模型训练方法、装置、电子设备及可读存储介质

AITNT
正文
推荐专利
大语言模型训练方法、装置、电子设备及可读存储介质
申请号:CN202510380268
申请日期:2025-03-28
公开号:CN120354232A
公开日期:2025-07-22
类型:发明专利
摘要
本申请公开了一种大语言模型训练方法、装置、电子设备及可读存储介质,该方法包括:接收云端服务器分发的待训练的初始大语言模型,以及获取用户特征数据集;根据目标任务需求从候选用户特征数据集中确定目标用户特征数据集;其中,所述候选用户特征数据集为所述云端服务器根据所述用户特征数据集确定;通过所述目标用户特征数据集以及奇异值分解算法对所述初始大语言模型的模型参数进行更新;将更新后的模型参数传输至所述云端服务器进行聚合,得到训练好的大语言模型。
技术关键词
大语言模型 奇异值分解算法 云端服务器 语言模型训练方法 数据 参数 智融标识网络 矩阵 计算机程序产品 可读存储介质 动态资源分配 训练装置 通信网络 标识上报 电子设备 指令 分发模块
系统为您推荐了相关专利信息
1
一种终端算力网络的节点稳定性评估方法及系统
GRU模型 稳定性评估方法 稳定性评估系统 指标 节点
2
基于Zubov方程的神经常微分稳定学习框架(Zubov-Net)
框架 采样器 方程 梯度下降算法 鲁棒性
3
一种基于人工智能的可研报告匹配度分析系统及方法
项目 数据模块 报告 数据处理模块 分析单元
4
一种利用高光谱遥感技术的土壤电导率快速测量方法
高光谱遥感技术 指数 多元线性回归模型 测量方法 地物光谱仪
5
一种基于Cascade Mask卷积神经网络的高通量多靶点微生物快检系统
菌落图像 风格迁移技术 微生物快速检测系统 智能检测系统 快检系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号