训练大语言模型的方法和装置

AITNT
正文
推荐专利
训练大语言模型的方法和装置
申请号:CN202510874340
申请日期:2025-06-26
公开号:CN120764618A
公开日期:2025-10-10
类型:发明专利
摘要
本说明书实施例提供一种训练大语言模型的方法和装置。第一大语言模型的生成数据包括,针对输入问题的答案或者针对输入问题的查询语句。方法包括:获取第一训练样本和第二训练样本,所述第一训练样本中的样本标签包括针对该第一训练样本中的输入问题的答案,所述第二训练样本中的样本标签包括针对该第二训练样本中的输入问题的查询语句;基于所述第一训练样本和所述第二训练样本,对所述第一大语言模型进行监督训练。能够保证稳定训练。
技术关键词
大语言模型 语句 答案 样本 文本 标签 指令 标记 计算机 数据 可读存储介质 存储器 策略 处理器 参数 序列
系统为您推荐了相关专利信息
1
基于深度学习的乳腺癌保乳术后瘤床靶区自动勾画系统
乳腺癌保乳 勾画系统 深度学习模型 图像处理单元 混合损失函数
2
一种文本生成图像方法、装置、设备及介质
文本生成图像方法 注意力 对象 图像生成单元 可读存储介质
3
一种基于人工智能的城市设计噪声优化方法和系统
三维城市模型 多层感知器网络 大语言模型 噪声预测模型 噪声优化方法
4
广告创意效果的预测方法、装置、设备和可读存储介质
多层感知网络 图像 视觉特征 显著性检测模型 样本
5
智慧城市多模态数据采集融合方法及系统
智慧城市系统 机器可读数据 多模态数据采集 朴素贝叶斯模型 方差贡献率
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号