大语言模型的训练方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
大语言模型的训练方法、装置、计算机设备及存储介质
申请号:CN202411488745
申请日期:2024-10-23
公开号:CN119397010B
公开日期:2025-10-14
类型:发明专利
摘要
本申请实施例公开了一种大语言模型的训练方法、装置、计算机设备及存储介质,属于计算机技术领域。在该方法中,通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本,为模型训练提供了更多可学习信息,同时由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正确语句和错误语句,通过对同一样本文本的两个不同摘要文本进行对比学习,并区分学习第一摘要文本中的正确语句和错误语句,避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题,不仅提高了模型的泛化性能,还提高了模型的准确性。
技术关键词
摘要 文本 语句 字符 大语言模型 样本 计算机设备 标签 参数 可读存储介质 训练装置 模块 存储器 处理器
系统为您推荐了相关专利信息
1
语音交互方法、服务器和计算机可读存储介质
自然语言 接口 大语言模型 列表 语音交互方法
2
一种基于图神经网络的区块调整措施推荐方法和系统
嵌入特征 措施 推荐方法 GCN模型 训练语言模型
3
一种建筑工程造价评估管理系统
评估管理系统 建筑材料 建筑工程造价 票据图像特征提取 票据图像处理
4
消息处理方法、装置、设备和存储介质
会话 消息通知 非暂时性机器可读存储介质 消息免打扰 大语言模型
5
基于智能体的任务处理方法、装置、设备、存储介质及程序产品
阶段 账号 多智能体协作 自然语言理解 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号