一种基于企业私有数据的领域自适应大模型微调方法及系统

AITNT
正文
推荐专利
一种基于企业私有数据的领域自适应大模型微调方法及系统
申请号:CN202511069908
申请日期:2025-07-31
公开号:CN120892792A
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及人工智能技术领域,具体涉及一种基于企业私有数据的领域自适应大模型微调方法及系统,方法包括:各参与客户端利用统一的预训练模型提取本地数据的特征表示,并采用均值、聚类或随机采样方法生成代表本地域类别特征的原型集合;对原型集合添加高斯随机噪声实现差分隐私保护后上传至服务器;服务器汇总所有客户端的原型,构建全局原型训练集,在不对不同客户端的同类原型进行平均的情况下,利用监督学习分类损失对适配器模块进行单次通信轮次的全局训练,得到全局适配器模型并下发客户端;客户端基于全局适配器模型初始化本地模型,并利用少量带标签数据进行微调,同时以全局模型为教师,通过知识蒸馏约束防止灾难性遗忘,实现全局知识保留与本地性能提升的平衡。本发明可以解决现有技术无法有效对齐不同企业的领域特征,导致模型在跨域推理任务中的表现显著下降的问题。
技术关键词
适配器 原型 微调方法 客户端 差分隐私机制 保护数据隐私 随机采样方法 随机噪声 样本 企业 蒸馏 服务器 采样率 带标签 预训练模型 执行聚类算法 差分隐私保护 隐私保护模块
系统为您推荐了相关专利信息
1
大模型微调方法、装置、设备、存储介质和程序产品
数据 蒸馏 微调方法 计算机可读指令 电子设备
2
一种基于无人机视觉的工程主体结构施工进度自动检测方法
工程主体结构 自动检测方法 无人机视觉 卷积模块 三分支结构
3
一种基于动态embedding的术语智能网关系统及方法
智能网关系统 术语 逻辑检测技术 语义网关 动态增量
4
任务型对话方法、存储介质及计算机设备
计划 服务器 生成工具 信息检索 对话方法
5
图像的生成方法、装置、程序产品、存储介质及电子设备
图像生成模型 空间结构信息 编码器 多模态注意力 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号