语义大模型增量预训练方法及相关装置

AITNT
正文
推荐专利
语义大模型增量预训练方法及相关装置
申请号:CN202411108350
申请日期:2024-08-13
公开号:CN119106664A
公开日期:2024-12-10
类型:发明专利
摘要
本发明属于人工智能领域,公开了一种语义大模型增量预训练方法及相关装置,包括:获取专业领域增量训练样本、语义大模型和语义大模型预训练样本;将语义大模型作为生成器和判别器构建对抗生成网络,并基于专业领域增量训练样本和语义大模型预训练样本训练对抗生成网络;获取训练后的对抗生成网络中的生成器,得到专业领域增量预训练大模型。可有效避免语义大模型在拟合专业领域增量训练样本时发生灾难性遗忘的风险,也有效避免了模型崩溃问题。可以在专业领域的数据基础上使用较小的算力、样本和时间成本完成增量训练,可借助语义大模型本身的理解能力,更好地学习和适应专业领域的专业术语、知识结构和业务逻辑,提高在专业领域的应用效果。
技术关键词
预训练方法 语义 专业 预训练系统 网络 样本 对抗性 输出模块 可读存储介质 数据获取模块 操作规程 处理器 计算机设备 电力 参数 存储器 噪声 标记 手册
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号