一种面向目标领域的大语言模型训练方法及装置

AITNT
正文
推荐专利
一种面向目标领域的大语言模型训练方法及装置
申请号:CN202411630161
申请日期:2024-11-15
公开号:CN119537596A
公开日期:2025-02-28
类型:发明专利
摘要
本申请提供了一种面向目标领域的大语言模型训练方法及装置,该大语言模型训练方法通过在目标领域下对通用的大语言模型进行分阶段微调训练的方式,不仅可以有效地提高大语言模型的模型训练效率,还有利于提高大语言模型在处理目标领域下相关问题时的鲁棒性,使得大语言模型能够更加准确地理解和处理目标领域下的相关问题。
技术关键词
大语言模型 语言模型训练方法 超参数 插件 分词 机器可读指令 人工智能模型 对抗性 模型训练装置 处理器 可读存储介质 终端 数据处理模块 意图识别 样本 词典
系统为您推荐了相关专利信息
1
一种直流换流变压器的故障检测方法
换流变压器 故障检测方法 深度学习算法 差分放大器技术 电力设备检测技术
2
基于大语言模型的上下文偏好学习方法、装置及设备
强化学习代理 大语言模型 学习方法 评分机制 指标
3
一种基于超参数驱动和数据增强的图像分割方法
超参数 图像分割方法 对比度 动态 图像增强
4
基于元学习的恶意代码基因信息隐性关联挖掘方法
关联挖掘方法 特征提取模型 节点特征 基因 序列
5
一种基于机器学习的商事主体风险评估方法及系统
商事主体 风险评估方法 企业 构建知识图谱 识别风险
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号