针对大语言模型的同类信息生成任务的训练方法及装置

AITNT
正文
推荐专利
针对大语言模型的同类信息生成任务的训练方法及装置
申请号:CN202510349501
申请日期:2025-03-21
公开号:CN120297273A
公开日期:2025-07-11
类型:发明专利
摘要
本说明书实施例提供针对大语言模型的同类信息生成任务的训练方法及装置,在利用大语言模型生成同类信息(如测试用例/样例、问答样本、近义表达等等)的情况下,可以使用种子信息和对应的标签信息作为训练样本,针对大语言模型处理种子信息得到的生成结果,一方面,通过大语言模型生成结果与标签信息比较,确定生成损失,另一方面,利用大语言模型生成同类信息过程中得到的概率分布进行连续化映射处理,根据处理结果得到相应词汇嵌入向量用于对生成结果进行质量检测,并确定质量损失。最终确定大语言模型的模型损失包括生成损失和质量损失,根据模型损失调整大语言模型的相关模型参数,可以使得大语言模型具备完成生成同类信息任务的能力。
技术关键词
大语言模型 问答匹配模型 标签 种子 答案 参数 训练装置 周期 计算机 可读存储介质 存储器 处理器 元素 样本 矩阵 数据
系统为您推荐了相关专利信息
1
基于大语言模型和自适应知识图谱的数据治理方法、模型、系统、产品及设备
数据治理方法 大语言模型 知识图谱数据处理 坐标系 数据治理系统
2
反射放大电路、芯片、射频标签和电子设备
输入输出模块 直流偏置模块 晶闸管 阻抗匹配模块 生成反射信号
3
数据脱敏方法、装置、介质和系统
脱敏数据 国密算法 加密算法 数据脱敏方法 身份证号
4
一种空间金字塔池化与上采样方式优化的图像识别方法
空间金字塔 图像识别方法 图像识别系统 网络模型训练 退火算法
5
一种基于RCM设备可靠性检修策略的动态物资管理系统及方法
物资管理系统 检修策略 预测设备故障 设备运行环境 动态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号