一种针对行业应用的大模型定制化训练方法及系统

AITNT
正文
推荐专利
一种针对行业应用的大模型定制化训练方法及系统
申请号:CN202510986130
申请日期:2025-07-17
公开号:CN120492599B
公开日期:2025-10-21
类型:发明专利
摘要
本申请公开了一种针对行业应用的大模型定制化训练方法及系统,主要涉及大模型技术领域,用以解决现有技术面临着如何准确切分术语、如何理解协议文档中的层级关系、如何增强模型对低频技术点的学习、无法有效适应通信领域复杂文档的特征,从而导致了模型在实际应用中的效果不稳定的问题。包括:采用预设术语重要性掩码作为大模型注意力权重的偏置项,将预设专业术语token在注意力得分矩阵中调整为预设提升值,并在每一行仅保留Top‑k最大注意力值;采用动态焦点损失函数,参与大模型参数自适应损失计算;迭代训练大模型,获得预训练好的大模型;在预训练完成后,采用对比学习进行领域自适应,获得训练完成的大模型。
技术关键词
问答语料 术语 焦点损失函数 注意力 依存句法树 答案 词典 依存句法分析 解码算法 语言模型概率 字符 训练语言模型 语义 参数 矩阵 动态位置编码 核心 低频技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号